hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Integrations
Servidor MCP de Firecrawl
Una implementación de servidor de Protocolo de contexto de modelo (MCP) que se integra con Firecrawl para capacidades de raspado web.
¡Muchas gracias a @vrknetha y @cawstudios por la implementación inicial!
Características
- Soporte para raspar, rastrear, buscar, extraer, investigar en profundidad y raspar por lotes
- Web scraping con renderizado JS
- Descubrimiento y rastreo de URL
- Búsqueda web con extracción de contenido
- Reintentos automáticos con retroceso exponencial
- Procesamiento por lotes eficiente con limitación de velocidad incorporada
- Monitoreo del uso de crédito para la API en la nube
- Sistema de registro integral
- Compatibilidad con instancias de FireCrawl alojadas en la nube y autoalojadas
- Compatibilidad con ventanas gráficas móviles y de escritorio
- Filtrado de contenido inteligente con inclusión/exclusión de etiquetas
Instalación
Ejecutando con npx
Instalación manual
Ejecutando en el cursor
Configuración del cursor 🖥️ Nota: Requiere la versión 0.45.6+ del cursor
Para configurar FireCrawl MCP en Cursor:
- Abrir configuración del cursor
- Vaya a Características > Servidores MCP
- Haga clic en "+ Agregar nuevo servidor MCP"
- Introduzca lo siguiente:
- Nombre: "firecrawl-mcp" (o el nombre que prefiera)
- Tipo: "comando"
- Comando:
env FIRECRAWL_API_KEY=your-api-key npx -y firecrawl-mcp
Si está usando Windows y tiene problemas, pruebe
cmd /c "set FIRECRAWL_API_KEY=your-api-key && npx -y firecrawl-mcp"
Reemplace your-api-key
con su clave API de FireCrawl.
Tras añadir, actualice la lista de servidores MCP para ver las nuevas herramientas. El agente de Composer usará automáticamente FireCrawl MCP cuando corresponda, pero puede solicitarlo explícitamente describiendo sus necesidades de web scraping. Acceda a Composer con Comando+L (Mac), seleccione "Agente" junto al botón de envío e introduzca su consulta.
Corriendo en Windsurf
Agregue esto a su ./codeium/windsurf/model_config.json
:
Instalación mediante herrería (legado)
Para instalar FireCrawl para Claude Desktop automáticamente a través de Smithery :
Configuración
Variables de entorno
Requerido para la API de la nube
FIRECRAWL_API_KEY
: Su clave API de FireCrawl- Obligatorio al utilizar la API en la nube (predeterminado)
- Opcional cuando se utiliza una instancia autohospedada con
FIRECRAWL_API_URL
FIRECRAWL_API_URL
(opcional): punto final de API personalizado para instancias autohospedadas- Ejemplo:
https://firecrawl.your-domain.com
- Si no se proporciona, se utilizará la API en la nube (requiere clave API)
- Ejemplo:
Configuración opcional
Reintentar configuración
FIRECRAWL_RETRY_MAX_ATTEMPTS
: Número máximo de intentos de reintento (predeterminado: 3)FIRECRAWL_RETRY_INITIAL_DELAY
: Retraso inicial en milisegundos antes del primer reintento (valor predeterminado: 1000)FIRECRAWL_RETRY_MAX_DELAY
: Retraso máximo en milisegundos entre reintentos (valor predeterminado: 10000)FIRECRAWL_RETRY_BACKOFF_FACTOR
: Multiplicador de retroceso exponencial (predeterminado: 2)
Monitoreo del uso del crédito
FIRECRAWL_CREDIT_WARNING_THRESHOLD
: Umbral de advertencia de uso de crédito (predeterminado: 1000)FIRECRAWL_CREDIT_CRITICAL_THRESHOLD
: Umbral crítico de uso de crédito (predeterminado: 100)
Ejemplos de configuración
Para el uso de API en la nube con reintentos personalizados y monitoreo de crédito:
Para instancia autohospedada:
Uso con Claude Desktop
Agregue esto a su claude_desktop_config.json
:
Configuración del sistema
El servidor incluye varios parámetros configurables mediante variables de entorno. Estos son los valores predeterminados si no se configuran:
Estas configuraciones controlan:
- Comportamiento de reintento
- Reintenta automáticamente las solicitudes fallidas debido a los límites de velocidad
- Utiliza un retroceso exponencial para evitar saturar la API
- Ejemplo: Con la configuración predeterminada, se realizarán reintentos en:
- 1er reintento: 1 segundo de retraso
- 2.º reintento: 2 segundos de retraso
- 3.er reintento: 4 segundos de retraso (limitado a maxDelay)
- Monitoreo del uso del crédito
- Realiza un seguimiento del consumo de créditos API para el uso de API en la nube
- Proporciona advertencias en umbrales específicos
- Ayuda a prevenir interrupciones inesperadas del servicio
- Ejemplo: Con configuración predeterminada:
- Advertencia: quedan 1000 créditos
- Alerta crítica cuando quedan 100 créditos
Limitación de velocidad y procesamiento por lotes
El servidor utiliza las capacidades de procesamiento por lotes y limitación de velocidad integradas de FireCrawl:
- Manejo automático del límite de velocidad con retroceso exponencial
- Procesamiento paralelo eficiente para operaciones por lotes
- Colas y limitación de solicitudes inteligentes
- Reintentos automáticos para errores transitorios
Herramientas disponibles
1. Herramienta de raspado ( firecrawl_scrape
)
Extraiga contenido de una única URL con opciones avanzadas.
2. Herramienta de raspado por lotes ( firecrawl_batch_scrape
)
Extraiga múltiples URL de manera eficiente con limitación de velocidad integrada y procesamiento paralelo.
La respuesta incluye el ID de la operación para verificar el estado:
3. Verificar el estado del lote ( firecrawl_check_batch_status
)
Comprobar el estado de una operación por lotes.
4. Herramienta de búsqueda ( firecrawl_search
)
Busque en la web y, opcionalmente, extraiga contenido de los resultados de búsqueda.
5. Herramienta de rastreo ( firecrawl_crawl
)
Inicie un rastreo asincrónico con opciones avanzadas.
6. Herramienta de extracción ( firecrawl_extract
)
Extraiga información estructurada de páginas web con las capacidades de LLM. Compatible con IA en la nube y extracción de LLM autoalojada.
Ejemplo de respuesta:
Opciones de la herramienta de extracción:
urls
: Matriz de URL de las que extraer informaciónprompt
: Aviso personalizado para la extracción de LLMsystemPrompt
: mensaje del sistema para guiar al LLMschema
: esquema JSON para extracción de datos estructuradosallowExternalLinks
: Permitir la extracción de enlaces externosenableWebSearch
: Habilita la búsqueda web para contexto adicionalincludeSubdomains
: Incluir subdominios en la extracción
Al usar una instancia autoalojada, la extracción usará el LLM configurado. Para la API en la nube, se usa el servicio LLM administrado de FireCrawl.
Sistema de registro
El servidor incluye un registro completo:
- Estado y progreso de la operación
- Métricas de rendimiento
- Monitoreo del uso del crédito
- Seguimiento del límite de velocidad
- Condiciones de error
Ejemplos de mensajes de registro:
Manejo de errores
El servidor proporciona un manejo robusto de errores:
- Reintentos automáticos para errores transitorios
- Manejo del límite de velocidad con retroceso
- Mensajes de error detallados
- Advertencias sobre el uso del crédito
- Resiliencia de la red
Ejemplo de respuesta de error:
Desarrollo
Contribuyendo
- Bifurcar el repositorio
- Crea tu rama de funciones
- Ejecutar pruebas:
npm test
- Enviar una solicitud de extracción
Licencia
Licencia MIT: consulte el archivo de LICENCIA para obtener más detalles
This server cannot be installed
Un servidor de protocolo de contexto de modelo que permite a los asistentes de IA realizar tareas avanzadas de raspado, rastreo, búsqueda y extracción de datos web a través de la API Firecrawl.