PDF Document MCP Server
Servidor MCP de documentos PDF
Por MEOK AI Labs | meok.ai
Kit de herramientas de procesamiento de documentos para agentes de IA. Extraiga texto, convierta a Markdown, combine PDF, extraiga tablas y resuma documentos: todo localmente y sin dependencias de API externas.
Herramientas
Herramienta | Descripción |
| Extrae texto de todas las páginas o de páginas específicas de un PDF |
| Convierte PDF a Markdown estructurado con detección de encabezados |
| Combina varios archivos PDF en un solo documento |
| Extrae estructuras de tablas de una página PDF mediante análisis de posición |
| Genera metadatos, estadísticas, encabezados y resúmenes por página |
Instalación
pip install mcp PyMuPDFNo se requieren servicios externos, claves de API ni dependencias en la nube. Todo el procesamiento se realiza localmente.
Uso
Ejecutar el servidor
python server.pyConfiguración de Claude Desktop
{
"mcpServers": {
"pdf-document": {
"command": "python",
"args": ["/path/to/pdf-document-mcp/server.py"]
}
}
}Ejemplos de llamadas
Extraer texto de un PDF:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}Extraer solo páginas específicas:
Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}Convertir PDF a Markdown:
Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}Extraer tablas:
Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}Combinar varios PDF:
Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}Resumir un documento:
Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}Precios
Nivel | Límite | Precio |
Gratuito | 20 llamadas/día | $0 |
Pro | Ilimitado + soporte OCR + procesamiento por lotes | $9/mes |
Enterprise | Personalizado + soporte prioritario | Contáctenos |
Licencia
MIT
This server cannot be installed
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server