MCP JinaAI Reader Server

by spences10
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Lector mcp-jinaai


⚠️ Aviso

Este repositorio ya no se mantiene.

La funcionalidad de esta herramienta ahora está disponible en mcp-omnisearch , que combina múltiples herramientas MCP en un paquete unificado.

Utilice mcp-omnisearch en su lugar.


Un servidor de Protocolo de Contexto de Modelo (MCP) para integrar la API de Lector de Jina.ai con LLM. Este servidor proporciona capacidades de extracción de contenido web eficientes y completas, optimizadas para la documentación y el análisis de contenido web.

Características

  • Extracción avanzada de contenido web a través de la API del lector Jina.ai
  • 🚀 Recuperación de contenido rápida y eficiente
  • 📄 Extracción de texto completa con estructura preservada
  • Formato limpio optimizado para LLM
  • 🌐 Soporte para varios tipos de contenido, incluida documentación
  • 🏗️ Construido sobre el Protocolo de Contexto Modelo

Configuración

Este servidor requiere configuración a través de su cliente MCP. A continuación, se muestran ejemplos para diferentes entornos:

Configuración de Cline

Agregue esto a su configuración de Cline MCP:

{ "mcpServers": { "jinaai-reader": { "command": "node", "args": ["-y", "mcp-jinaai-reader"], "env": { "JINAAI_API_KEY": "your-jinaai-api-key" } } } }

Escritorio Claude con configuración WSL

Para entornos WSL, agregue esto a su configuración de Claude Desktop:

{ "mcpServers": { "jinaai-reader": { "command": "wsl.exe", "args": [ "bash", "-c", "JINAAI_API_KEY=your-jinaai-api-key npx mcp-jinaai-reader" ] } } }

Variables de entorno

El servidor requiere la siguiente variable de entorno:

  • JINAAI_API_KEY : Su clave API de Jina.ai (obligatoria)

API

El servidor implementa una única herramienta MCP con parámetros configurables:

leer_url

Convierta cualquier URL en texto compatible con LLM utilizando Jina.ai Reader.

Parámetros:

  • url (cadena, obligatoria): URL a procesar
  • no_cache (booleano, opcional): Omite la caché para resultados actualizados. El valor predeterminado es falso.
  • format (cadena, opcional): Formato de respuesta ("json" o "stream"). El valor predeterminado es "json".
  • timeout (número, opcional): tiempo máximo en segundos para esperar la carga de la página web
  • target_selector (cadena, opcional): selector CSS para centrarse en elementos específicos
  • wait_for_selector (cadena, opcional): selector CSS para esperar elementos específicos
  • remove_selector (cadena, opcional): selector CSS para excluir elementos específicos
  • with_links_summary (booleano, opcional): Recopilar todos los enlaces al final de la respuesta
  • with_images_summary (booleano, opcional): Recopilar todas las imágenes al final de la respuesta
  • with_generated_alt (booleano, opcional): agrega texto alternativo a las imágenes que no tienen subtítulos
  • with_iframe (booleano, opcional): incluye contenido iframe en la respuesta

Desarrollo

Configuración

  1. Clonar el repositorio
  2. Instalar dependencias:
npm install
  1. Construir el proyecto:
npm run build
  1. Ejecutar en modo de desarrollo:
npm run dev

Publicación

  1. Actualizar la versión en package.json
  2. Construir el proyecto:
npm run build
  1. Publicar en npm:
npm publish

Contribuyendo

¡Agradecemos sus contribuciones! No dude en enviar una solicitud de incorporación de cambios.

Licencia

Licencia MIT: consulte el archivo LICENCIA para obtener más detalles.

Expresiones de gratitud

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Integra la API de lectura de Jina.ai con LLM para una extracción de contenido web eficiente y estructurada, optimizada para la documentación y el análisis de contenido web.

  1. ⚠️ Notice
    1. Features
      1. Configuration
        1. Cline Configuration
        2. Claude Desktop with WSL Configuration
        3. Environment Variables
      2. API
        1. read_url
      3. Development
        1. Setup
        2. Publishing
      4. Contributing
        1. License
          1. Acknowledgments
            ID: a75afsx9cx