mcp-servidor-fetch-python
Un servidor MCP para obtener y transformar contenido web a diversos formatos. Este servidor proporciona herramientas integrales para extraer contenido de páginas web, incluyendo compatibilidad con contenido renderizado en JavaScript y archivos multimedia.
Características
Herramientas
El servidor proporciona cuatro herramientas especializadas:
- get-raw-text : extrae contenido de texto sin procesar directamente de las URL sin necesidad de renderizarlo en el navegador
- Argumentos:
url
: URL de la página web de destino (texto, JSON, XML, csv, tsv, etc.) (obligatorio)
- Se utiliza mejor para formatos de datos estructurados o cuando se necesita acceso rápido y directo.
- Argumentos:
- get-rendered-html : obtiene contenido HTML completamente renderizado mediante un navegador sin interfaz gráfica
- Argumentos:
url
: URL de la página web de destino (obligatorio)
- Esencial para aplicaciones web modernas y SPA que requieren representación de JavaScript
- Argumentos:
- get-markdown : Convierte el contenido de la página web a Markdown bien formateado
- Argumentos:
url
: URL de la página web de destino (obligatorio)
- Conserva los elementos estructurales al tiempo que proporciona una salida de texto limpia y legible.
- Argumentos:
- get-markdown-from-media : realiza la extracción de contenido de archivos multimedia mediante IA.
- Argumentos:
url
: URL del archivo multimedia de destino (imágenes, vídeos) (obligatorio)
- Utiliza visión artificial y OCR para el análisis de contenido visual.
- Requiere que se configure una OPENAI_API_KEY válida en las variables de entorno
- Devolverá un mensaje de error si la clave API no está configurada o si hay problemas al procesar el archivo multimedia
- Argumentos:
Uso
Escritorio de Claude
Para utilizar con Claude Desktop, agregue la configuración del servidor:
En MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json
En Windows: %APPDATA%/Claude/claude_desktop_config.json
Variables de entorno
Se pueden configurar las siguientes variables de entorno:
- OPENAI_API_KEY : Necesaria para usar la herramienta
get-markdown-from-media
. Esta clave es necesaria para el análisis de imágenes y la extracción de contenido con IA. - PYTHONIOENCODING : configúrelo en "utf-8" si encuentra problemas de codificación de caracteres en la salida.
- MODEL_NAME : Especifica el nombre del modelo a utilizar. El valor predeterminado es "gpt-4o".
Instalación local
Alternativamente, puede instalar y ejecutar el servidor localmente:
Luego agregue la siguiente configuración al archivo de configuración de Claude Desktop:
Desarrollo
Depuración
Puede iniciar el Inspector MCP usando npx con los siguientes comandos:
You must be authenticated.
Un servidor MCP para obtener y transformar contenido web en varios formatos.
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA powerful MCP server for fetching and transforming web content into various formats (HTML, JSON, Markdown, Plain Text) with ease.Last updated -414612TypeScriptMIT License
- AsecurityAlicenseAqualityA simple MCP server that facilitates website fetching through a configurable server platform using stdio or SSE transport, allowing integration with tools like Cursor for streamlined access.Last updated -223PythonMIT License
- -securityAlicense-qualityAn MCP server that enables fetching web content using the Node.js undici library, supporting various HTTP methods, content formats, and request configurations.Last updated -668TypeScriptMIT License
- AsecurityAlicenseAqualityAn MCP server that retrieves web page content using Playwright headless browser, capable of extracting main content and converting to Markdown format.Last updated -2584699TypeScriptMIT License