Skip to main content
Glama

Servidor MCP de documentos PDF

Por MEOK AI Labs | meok.ai

Kit de herramientas de procesamiento de documentos para agentes de IA. Extraiga texto, convierta a Markdown, combine PDF, extraiga tablas y resuma documentos: todo localmente y sin dependencias de API externas.

Herramientas

Herramienta

Descripción

extract_text_from_pdf

Extrae texto de todas las páginas o de páginas específicas de un PDF

convert_pdf_to_markdown

Convierte PDF a Markdown estructurado con detección de encabezados

merge_pdfs

Combina varios archivos PDF en un solo documento

extract_tables

Extrae estructuras de tablas de una página PDF mediante análisis de posición

summarize_document

Genera metadatos, estadísticas, encabezados y resúmenes por página

Instalación

pip install mcp PyMuPDF

No se requieren servicios externos, claves de API ni dependencias en la nube. Todo el procesamiento se realiza localmente.

Uso

Ejecutar el servidor

python server.py

Configuración de Claude Desktop

{
  "mcpServers": {
    "pdf-document": {
      "command": "python",
      "args": ["/path/to/pdf-document-mcp/server.py"]
    }
  }
}

Ejemplos de llamadas

Extraer texto de un PDF:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}

Extraer solo páginas específicas:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}

Convertir PDF a Markdown:

Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}

Extraer tablas:

Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}

Combinar varios PDF:

Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}

Resumir un documento:

Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}

Precios

Nivel

Límite

Precio

Gratuito

20 llamadas/día

$0

Pro

Ilimitado + soporte OCR + procesamiento por lotes

$9/mes

Enterprise

Personalizado + soporte prioritario

Contáctenos

Licencia

MIT

-
security - not tested
F
license - not found
-
quality - not tested

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server