Provides HTML documentation hosted on GitHub Pages with complete setup guides, configuration instructions, and API reference for the MCP RAG server
Uses Hugging Face's sentence transformers API to generate embeddings for semantic search in the RAG system, specifically leveraging the sentence-transformers/all-MiniLM-L6-v2 model for document and memory vectorization
MCP RAG
Um servidor MCP (Model Context Protocol) completo para RAG (Retrieval-Augmented Generation) com gerenciamento de arquivos e memória vetorial para agentes.
🚀 Características
- 📄 Gerenciamento de Arquivos: Adicione, remova e pesquise documentos em diversos formatos (PDF, DOCX, TXT, MD, CSV, JSON)
- 🧠 Memória Vetorial: Sistema separado para que agentes armazenem informações importantes para uso futuro
- 🔍 Busca Semântica: Utiliza embeddings do Hugging Face para busca semântica avançada
- 💾 Banco Vetorial Local: ChromaDB local para armazenamento eficiente de vetores e metadados
- 🛠️ Script de Manutenção: CLI completo para gerenciamento e manutenção do sistema
- 📚 Documentação Completa: HTML para GitHub Pages com guias de configuração
📋 Pré-requisitos
- Node.js 18+
- npm ou yarn
- Chave da API do Hugging Face
🛠️ Instalação
- Clone o repositório
- Instale as dependências
- Configure as variáveis de ambienteEdite o arquivo
.env
e configure sua chave da API do Hugging Face: - Compile o projeto
🔧 Configuração
Cursor
Adicione a seguinte configuração no arquivo de configurações do MCP:
Claude Desktop
Adicione a configuração no arquivo claude_desktop_config.json
:
VS Code
Configure no settings.json
:
🛠️ Script de Manutenção
O projeto inclui um CLI completo para manutenção:
🔍 Ferramentas MCP Disponíveis
Gerenciamento de Arquivos
add_file
: Adiciona um arquivo ao sistema RAGsearch_files
: Busca documentos relevantesremove_file
: Remove um arquivo do sistemalist_files
: Lista todos os arquivos no sistema
Gerenciamento de Memória
add_memory
: Adiciona informação à memória do agentesearch_memory
: Busca na memória do agenteremove_memory
: Remove uma entrada da memóriaget_memory_by_agent
: Obtém toda a memória de um agente
Utilitários
get_stats
: Obtém estatísticas do sistemaclear_data
: Limpa dados do sistematest_connection
: Testa a conexão com o serviço de embeddings
📊 Formatos Suportados
- PDF: Documentos PDF com texto extraível
- DOCX: Documentos do Microsoft Word
- TXT: Arquivos de texto simples
- MD: Arquivos Markdown
- CSV: Arquivos de dados separados por vírgula
- JSON: Arquivos de dados JSON
⚙️ Configurações
Variáveis de Ambiente
🚀 Uso
Iniciando o Servidor
Desenvolvimento
Testes
📚 Documentação
A documentação completa está disponível em HTML para GitHub Pages em docs/index.html
. Ela inclui:
- Guias de instalação e configuração
- Instruções para Cursor, Claude Desktop e VS Code
- Exemplos de uso
- Solução de problemas
- Referência completa das ferramentas
🤝 Contribuição
- Fork o projeto
- Crie uma branch para sua feature (
git checkout -b feature/AmazingFeature
) - Commit suas mudanças (
git commit -m 'Add some AmazingFeature'
) - Push para a branch (
git push origin feature/AmazingFeature
) - Abra um Pull Request
📄 Licença
Este projeto está licenciado sob a Licença MIT - veja o arquivo LICENSE para detalhes.
🙏 Agradecimentos
- Model Context Protocol - Protocolo base
- Hugging Face - Serviço de embeddings
- ChromaDB - Banco de dados vetorial
- Anthropic - Claude e MCP
📞 Suporte
Se você encontrar problemas ou tiver dúvidas:
- Verifique a documentação HTML
- Abra uma issue
- Consulte a seção de solução de problemas na documentação
Desenvolvido com ❤️ para a comunidade de IA
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
A complete MCP server for Retrieval-Augmented Generation with file management and vector memory for agents. Supports multiple document formats (PDF, DOCX, TXT, MD, CSV, JSON) with semantic search using Hugging Face embeddings and ChromaDB for efficient vector storage.
Related MCP Servers
- -securityAlicense-qualityAn MCP server that provides multiple file conversion tools for AI agents, supporting various document and image format conversions including DOCX to PDF, PDF to DOCX, image conversions, Excel to CSV, HTML to PDF, and Markdown to PDF.Last updated -16MIT License
- -security-license-qualityA Retrieval-Augmented Generation server that enables semantic PDF search with OCR capabilities, allowing users to query document content through any MCP client and receive intelligent answers.Last updated -1Apache 2.0
- -securityFlicense-qualityAn advanced MCP server providing RAG-enabled memory through a knowledge graph with vector search capabilities, enabling intelligent information storage, semantic retrieval, and document processing.Last updated -1220
- -securityFlicense-qualityAn MCP server that implements Retrieval-Augmented Generation to efficiently retrieve and process important information from various sources, providing accurate and contextually relevant responses.Last updated -