Skip to main content
Glama

MCP Firecrawl Server

by codyde

Servidor Firecrawl de MCP

Este es un servidor MCP simple que proporciona herramientas para rastrear sitios web y extraer datos estructurados utilizando las API de Firecrawl.

Configuración

  1. Instalar dependencias:
npm install
  1. Cree un archivo .env en el directorio raíz con las siguientes variables:
FIRECRAWL_API_TOKEN=your_token_here SENTRY_DSN=your_sentry_dsn_here
  • FIRECRAWL_API_TOKEN (obligatorio): Su token de API de Firecrawl
  • SENTRY_DSN (opcional): Sentry DSN para seguimiento de errores y monitoreo del rendimiento
  1. Iniciar el servidor:
npm start

Alternativamente, puede configurar variables de entorno directamente al ejecutar el servidor:

FIRECRAWL_API_TOKEN=your_token_here npm start

Características

  • Extracción de sitios web : extraiga contenido de sitios web en varios formatos
  • Extracción de datos estructurados : extraiga puntos de datos específicos según esquemas personalizados
  • Seguimiento de errores : integrado con Sentry para el seguimiento de errores y la supervisión del rendimiento

Uso

El servidor expone dos herramientas:

  1. scrape-website : Extracción básica de sitios web con múltiples opciones de formato
  2. extract-data : Extracción de datos estructurados basada en indicaciones y esquemas

Herramienta: scrape-website

Esta herramienta raspa un sitio web y devuelve su contenido en los formatos solicitados.

Parámetros:

  • url (cadena, obligatoria): la URL del sitio web que se va a rastrear
  • formats (matriz de cadenas, opcional): Matriz de formatos de salida deseados. Los formatos admitidos son:
    • "markdown" (predeterminado)
    • "html"
    • "text"

Ejemplo de uso con MCP Inspector:

# Basic usage (defaults to markdown) mcp-inspector --tool scrape-website --args '{ "url": "https://example.com" }' # Multiple formats mcp-inspector --tool scrape-website --args '{ "url": "https://example.com", "formats": ["markdown", "html", "text"] }'

Herramienta: extraer datos

Esta herramienta extrae datos estructurados de sitios web basándose en un esquema y una solicitud proporcionados.

Parámetros:

  • urls (matriz de cadenas, obligatoria): Matriz de URL de las que extraer datos
  • prompt (cadena, obligatorio): el mensaje que describe qué datos extraer
  • schema (objeto, requerido): Definición del esquema para los datos a extraer

La definición del esquema debe ser un objeto donde las claves sean nombres de campo y los valores sean tipos. Los tipos admitidos son:

  • "string" : para campos de texto
  • "boolean" : para campos verdaderos/falsos
  • "number" : para campos numéricos
  • Matrices: se especifican como ["type"] donde el tipo es uno de los anteriores
  • Objetos: objetos anidados con sus propias definiciones de tipo

Ejemplo de uso con MCP Inspector:

# Basic example extracting company information mcp-inspector --tool extract-data --args '{ "urls": ["https://example.com"], "prompt": "Extract the company mission, whether it supports SSO, and whether it is open source.", "schema": { "company_mission": "string", "supports_sso": "boolean", "is_open_source": "boolean" } }' # Complex example with nested data mcp-inspector --tool extract-data --args '{ "urls": ["https://example.com/products", "https://example.com/pricing"], "prompt": "Extract product information including name, price, and features.", "schema": { "products": [{ "name": "string", "price": "number", "features": ["string"] }] } }'

Ambas herramientas devolverán mensajes de error apropiados si el raspado o la extracción fallan y registrarán automáticamente los errores en Sentry si está configurado.

Solución de problemas

Si encuentra problemas:

  1. Verifique que su token de API de Firecrawl sea válido
  2. Comprueba que las URL que intentas extraer sean accesibles
  3. Para esquemas complejos, asegúrese de que sigan el formato admitido
  4. Revise los registros de Sentry para obtener información detallada de errores (si está configurado)

You must be authenticated.

A
security – no known vulnerabilities
F
license - not found
A
quality - confirmed to work

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Un servidor que proporciona herramientas para raspar sitios web y extraer datos estructurados de ellos mediante las API de Firecrawl, admitiendo tanto el raspado básico de sitios web en múltiples formatos como la extracción de datos basada en esquemas personalizados.

  1. Configuración
    1. Características
      1. Uso
        1. Herramienta: scrape-website
        2. Herramienta: extraer datos
      2. Solución de problemas

        Related MCP Servers

        • A
          security
          A
          license
          A
          quality
          A Model Context Protocol (MCP) server implementation that integrates with FireCrawl for advanced web scraping capabilities.
          Last updated -
          9
          16,506
          3,053
          JavaScript
          MIT License
          • Apple
          • Linux
        • A
          security
          A
          license
          A
          quality
          A server that provides web scraping and intelligent content searching capabilities using the Firecrawl API, enabling AI agents to extract structured data from websites and perform content searches.
          Last updated -
          5
          2
          TypeScript
          MIT License
          • Apple
          • Linux
        • -
          security
          A
          license
          -
          quality
          A Model Context Protocol server that enables AI assistants to perform advanced web scraping, crawling, searching, and data extraction through the Firecrawl API.
          Last updated -
          16,506
          MIT License
          • Apple
          • Linux
        • A
          security
          A
          license
          A
          quality
          A scraper tool that leverages the Oxylabs Web Scraper API to fetch and process web content with flexible options for parsing and rendering pages, enabling efficient content extraction from complex websites.
          Last updated -
          2
          32
          Python
          MIT License
          • Apple
          • Linux

        View all related MCP servers

        MCP directory API

        We provide all the information about MCP servers via our MCP API.

        curl -X GET 'https://glama.ai/api/mcp/v1/servers/codyde/mcp-firecrawl-tool'

        If you have feedback or need assistance with the MCP directory API, please join our Discord server