MCP PDF Reader

SUMMARY.md•4.99 KiB

# Resumen del Proyecto MCP PDF Reader ## Proyecto Completado Se ha desarrollado exitosamente un servidor MCP (Model Context Protocol) para leer y extraer información de archivos PDF. ## 📁 Estructura Creada ```text mcp-pdf-reader/ ├── src/ │ ├── __tests__/ │ │ └── pdf-tools.test.ts # Tests unitarios │ ├── index.ts # Servidor MCP principal │ ├── pdf-tools.ts # Funciones de lectura de PDF │ └── types.ts # Tipos TypeScript ├── test-files/ # Carpeta para PDFs de prueba ├── dist/ # Código compilado ├── LICENSE ├── CHANGELOG.md ├── package.json # Configuración del proyecto ├── tsconfig.json # Configuración TypeScript ├── jest.config.js # Configuración de tests ├── README.md # Documentación principal ├── CLAUDE_CONFIG.md # Guía de configuración para Claude ├── COPILOT_CONFIG.md # Guía de configuración para Claude ├── example.ts # Ejemplo de uso └── Makefile ``` ## 🚀 Características Implementadas ### 5 Herramientas MCP: 1. **read_pdf** - Extrae todo el texto de un PDF con opción de incluir metadatos 2. **get_pdf_metadata** - Obtiene metadatos (título, autor, fechas, etc.) 3. **read_pdf_pages** - Extrae texto de páginas específicas o rangos 4. **search_pdf** - Busca texto en el PDF con soporte para case-sensitive 5. **get_pdf_page_count** - Obtiene el número total de páginas ### Funcionalidades: - Extracción de texto completo - Extracción de metadatos (título, autor, creador, fechas) - Lectura de páginas específicas - Búsqueda de texto con contexto - Soporte para búsqueda case-sensitive/insensitive - Manejo de errores robusto - Tests unitarios completos - Tipado completo con TypeScript - Compilación a ES Modules ## 🧪 Tests - **27 tests unitarios** cubriendo todas las funciones principales - **Todos los tests pasando** correctamente - **Tests específicos del contenido** del PDF proporcionado (test-files/sample.pdf) - **Validaciones concretas**: número de páginas, metadatos, textos específicos, búsquedas - **Extracción de tablas**: Test que extrae y muestra tablas en formato ASCII - **Procesamiento de imágenes**: Tests que listan y extraen imágenes del PDF - Ejecución: `npm test` - Resultado: **Test Suites: 1 passed, Tests: 27 passed (3.173 s)** ### Detalles de los tests: - **getPageCount** (2 tests): Validación del conteo exacto de 6 páginas - **extractMetadata** (2 tests): Verificación de autor, creador, productor y fechas - **extractTextFromPDF** (3 tests): Extracción completa y validación de contenidos específicos - **extractPages** (6 tests): Extracción de páginas individuales, rangos, y validación de errores - **searchInPDF** (8 tests): Búsquedas de términos específicos, case-sensitivity, contexto - **Table Extraction** (1 test): Extracción y visualización de tabla en formato ASCII - **PDF Images** (5 tests): Listado y extracción de imágenes incrustadas ## 📦 Tecnologías Utilizadas - **@modelcontextprotocol/sdk** (v1.25.2) - SDK MCP - **pdf-parse** (v2.4.5) - Librería para parsear PDFs (texto) - **pdf-lib** (v1.17.1) - Librería para manipulación de PDFs (imágenes) - **TypeScript** (v5.9.3) - Lenguaje con tipado estático - **Jest** (v29.7.0) - Framework de testing - **ts-jest** (v29.2.5) - Preset de Jest para TypeScript ## Scripts Disponibles ```bash npm run build # Compilar TypeScript a JavaScript npm run dev # Modo desarrollo (watch) npm start # Ejecutar servidor MCP npm test # Ejecutar tests npm run test:watch # Tests en modo watch ``` ## 📝 Estado Final del Proyecto ### Completado exitosamente: 1. **Servidor MCP implementado** con 5 herramientas funcionales 2. **Tests completos** ejecutados con el PDF de prueba proporcionado por el usuario 3. **Compilación exitosa** sin errores ni advertencias 4. **Documentación completa** en README.md 5. **Código totalmente tipado** con TypeScript ### 🎯 Listo para usar: El servidor está completamente funcional y listo para integrarse con Claude Desktop o cualquier cliente MCP compatible. ## 🎯 Uso con Claude Desktop Una vez configurado, puedes pedirle a Claude: - "Lee el PDF en C:/ruta/al/archivo.pdf" - "Extrae los metadatos del PDF en..." - "Busca la palabra 'ejemplo' en el PDF..." - "Lee las páginas 1 a 5 del PDF..." - "¿Cuántas páginas tiene el PDF...?" ## ⚡ Compilación y Ejecución El proyecto compila exitosamente sin errores y está listo para usarse. ```bash # Instalar dependencias (ya hecho) npm install # Compilar (ya hecho) npm run build # Ejecutar servidor npm start ``` ## Notas Importantes - No incluye OCR (reconocimiento óptico) - Funciona mejor con PDFs bien formados - Requiere Node.js para ejecutarse - Compatible con Windows, macOS y Linux

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/rturv/mcp-pdf-reader'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

SUMMARY.md•4.99 KiB