Servidor Firecrawl de MCP
Este es un servidor MCP simple que proporciona herramientas para rastrear sitios web y extraer datos estructurados utilizando las API de Firecrawl.
Configuración
Instalar dependencias:
Cree un archivo
.enven el directorio raíz con las siguientes variables:
FIRECRAWL_API_TOKEN(obligatorio): Su token de API de FirecrawlSENTRY_DSN(opcional): Sentry DSN para seguimiento de errores y monitoreo del rendimiento
Iniciar el servidor:
Alternativamente, puede configurar variables de entorno directamente al ejecutar el servidor:
Características
Extracción de sitios web : extraiga contenido de sitios web en varios formatos
Extracción de datos estructurados : extraiga puntos de datos específicos según esquemas personalizados
Seguimiento de errores : integrado con Sentry para el seguimiento de errores y la supervisión del rendimiento
Uso
El servidor expone dos herramientas:
scrape-website: Extracción básica de sitios web con múltiples opciones de formatoextract-data: Extracción de datos estructurados basada en indicaciones y esquemas
Herramienta: scrape-website
Esta herramienta raspa un sitio web y devuelve su contenido en los formatos solicitados.
Parámetros:
url(cadena, obligatoria): la URL del sitio web que se va a rastrearformats(matriz de cadenas, opcional): Matriz de formatos de salida deseados. Los formatos admitidos son:"markdown"(predeterminado)"html""text"
Ejemplo de uso con MCP Inspector:
Herramienta: extraer datos
Esta herramienta extrae datos estructurados de sitios web basándose en un esquema y una solicitud proporcionados.
Parámetros:
urls(matriz de cadenas, obligatoria): Matriz de URL de las que extraer datosprompt(cadena, obligatorio): el mensaje que describe qué datos extraerschema(objeto, requerido): Definición del esquema para los datos a extraer
La definición del esquema debe ser un objeto donde las claves sean nombres de campo y los valores sean tipos. Los tipos admitidos son:
"string": para campos de texto"boolean": para campos verdaderos/falsos"number": para campos numéricosMatrices: se especifican como
["type"]donde el tipo es uno de los anterioresObjetos: objetos anidados con sus propias definiciones de tipo
Ejemplo de uso con MCP Inspector:
Ambas herramientas devolverán mensajes de error apropiados si el raspado o la extracción fallan y registrarán automáticamente los errores en Sentry si está configurado.
Solución de problemas
Si encuentra problemas:
Verifique que su token de API de Firecrawl sea válido
Comprueba que las URL que intentas extraer sean accesibles
Para esquemas complejos, asegúrese de que sigan el formato admitido
Revise los registros de Sentry para obtener información detallada de errores (si está configurado)
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Un servidor que proporciona herramientas para raspar sitios web y extraer datos estructurados de ellos mediante las API de Firecrawl, admitiendo tanto el raspado básico de sitios web en múltiples formatos como la extracción de datos basada en esquemas personalizados.
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.Last updated -4376610MIT License
- Asecurity-licenseAqualityA server that provides web scraping and intelligent content searching capabilities using the Firecrawl API, enabling AI agents to extract structured data from websites and perform content searches.Last updated -2MIT License
- Asecurity-licenseAqualityProvides functionality to fetch web content in various formats, including HTML, JSON, plain text, and Markdown.Last updated -4104,1622
Oxylabs MCP Serverofficial
Asecurity-licenseAqualityA scraper tool that leverages the Oxylabs Web Scraper API to fetch and process web content with flexible options for parsing and rendering pages, enabling efficient content extraction from complex websites.Last updated -267MIT License