Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@MCP PDF Readersummarize pages 1 to 3 of C:/Users/Documents/contract.pdf"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
MCP PDF Reader
Un servidor MCP (Model Context Protocol) para leer y extraer información de archivos PDF.
Características
📄 Extracción completa de texto de PDFs
📊 Extracción de metadatos (título, autor, fechas, etc.)
📖 Lectura de páginas específicas
🔍 Búsqueda de texto con contexto
📏 Conteo de páginas
Instalación
Uso
Como servidor MCP independiente
Configuración en Claude Desktop
Añade esto a tu archivo de configuración de Claude Desktop (claude_desktop_config.json):
Herramientas disponibles
1. read_pdf
Extrae todo el texto de un archivo PDF.
Parámetros:
filePath(string, requerido): Ruta absoluta al archivo PDFincludeMetadata(boolean, opcional): Incluir metadatos en la respuesta
Ejemplo:
2. get_pdf_metadata
Extrae solo los metadatos del PDF.
Parámetros:
filePath(string, requerido): Ruta absoluta al archivo PDF
Retorna: Objeto JSON con metadatos (título, autor, fechas, etc.)
3. read_pdf_pages
Extrae texto de páginas específicas.
Parámetros:
filePath(string, requerido): Ruta absoluta al archivo PDFstartPage(number, requerido): Página inicial (base 1)endPage(number, opcional): Página final (por defecto: startPage)
Ejemplo:
4. search_pdf
Busca un término en el PDF y devuelve coincidencias con contexto.
Parámetros:
filePath(string, requerido): Ruta absoluta al archivo PDFsearchTerm(string, requerido): Texto a buscarcaseSensitive(boolean, opcional): Búsqueda sensible a mayúsculas (por defecto: false)
Retorna: Array de resultados con página, texto, contexto y posición.
5. get_pdf_page_count
Obtiene el número total de páginas del PDF.
Parámetros:
filePath(string, requerido): Ruta absoluta al archivo PDF
6. list_pdf_images
Lista todas las imágenes incrustadas en el PDF con sus metadatos.
Parámetros:
filePath(string, requerido): Ruta absoluta al archivo PDF
Retorna:
7. extract_pdf_image
Extrae una imagen específica del PDF por su índice (usa list_pdf_images para obtener los índices disponibles).
Parámetros:
filePath(string, requerido): Ruta absoluta al archivo PDFimageIndex(number, requerido): Índice de la imagen a extraer (base 0)
Retorna:
Desarrollo
Compilar el proyecto
Modo desarrollo (watch)
Ejecutar tests
Nota: Para ejecutar los tests completamente, necesitas proporcionar un archivo PDF de prueba en test-files/sample.pdf.
Ejecutar tests en modo watch
Estructura del proyecto
Tecnologías utilizadas
@modelcontextprotocol/sdk: SDK para el protocolo MCP
pdf-parse: Librería para parsear archivos PDF (texto)
pdf-lib: Librería para manipulación de PDFs (imágenes)
TypeScript: Lenguaje de programación con tipado estático
Jest: Framework de testing
Limitaciones
No incluye OCR (reconocimiento óptico de caracteres)
Funciona mejor con PDFs bien formados que contienen texto seleccionable
La extracción de imágenes funciona con formatos estándar (JPEG, PNG, TIFF)
Las imágenes se devuelven en formato Base64
Licencia
ISC