remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Integrations
Enables fetching content from JavaScript-rendered pages through a headless browser, making it possible to extract content from modern web applications and SPAs
Converts web page content to well-formatted Markdown while preserving structural elements like tables and definition lists
Leverages OpenAI's vision capabilities for AI-powered content extraction from media files (images and videos) when provided with an API key
mcp-servidor-fetch-python
Un servidor MCP para obtener y transformar contenido web a diversos formatos. Este servidor proporciona herramientas integrales para extraer contenido de páginas web, incluyendo compatibilidad con contenido renderizado en JavaScript y archivos multimedia.
Características
Herramientas
El servidor proporciona cuatro herramientas especializadas:
- get-raw-text : extrae contenido de texto sin procesar directamente de las URL sin necesidad de renderizarlo en el navegador
- Argumentos:
url
: URL de la página web de destino (texto, JSON, XML, csv, tsv, etc.) (obligatorio)
- Se utiliza mejor para formatos de datos estructurados o cuando se necesita acceso rápido y directo.
- Argumentos:
- get-rendered-html : obtiene contenido HTML completamente renderizado mediante un navegador sin interfaz gráfica
- Argumentos:
url
: URL de la página web de destino (obligatorio)
- Esencial para aplicaciones web modernas y SPA que requieren representación de JavaScript
- Argumentos:
- get-markdown : Convierte el contenido de la página web a Markdown bien formateado
- Argumentos:
url
: URL de la página web de destino (obligatorio)
- Conserva los elementos estructurales al tiempo que proporciona una salida de texto limpia y legible.
- Argumentos:
- get-markdown-from-media : realiza la extracción de contenido de archivos multimedia mediante IA.
- Argumentos:
url
: URL del archivo multimedia de destino (imágenes, vídeos) (obligatorio)
- Utiliza visión artificial y OCR para el análisis de contenido visual.
- Requiere que se configure una OPENAI_API_KEY válida en las variables de entorno
- Devolverá un mensaje de error si la clave API no está configurada o si hay problemas al procesar el archivo multimedia
- Argumentos:
Uso
Escritorio de Claude
Para utilizar con Claude Desktop, agregue la configuración del servidor:
En MacOS: ~/Library/Application\ Support/Claude/claude_desktop_config.json
En Windows: %APPDATA%/Claude/claude_desktop_config.json
Variables de entorno
Se pueden configurar las siguientes variables de entorno:
- OPENAI_API_KEY : Necesaria para usar la herramienta
get-markdown-from-media
. Esta clave es necesaria para el análisis de imágenes y la extracción de contenido con IA. - PYTHONIOENCODING : configúrelo en "utf-8" si encuentra problemas de codificación de caracteres en la salida.
- MODEL_NAME : Especifica el nombre del modelo a utilizar. El valor predeterminado es "gpt-4o".
Instalación local
Alternativamente, puede instalar y ejecutar el servidor localmente:
Luego agregue la siguiente configuración al archivo de configuración de Claude Desktop:
Desarrollo
Depuración
Puede iniciar el Inspector MCP usando npx con los siguientes comandos:
You must be authenticated.
Un servidor MCP para obtener y transformar contenido web en varios formatos.