Skip to main content
Glama

Doc Scraper MCP Server

Servidor MCP de Doc Scraper

Un servidor de Protocolo de Contexto de Modelo (MCP) que proporciona la funcionalidad de extracción de documentación. Este servidor convierte la documentación web a formato Markdown mediante el servicio de conversión de jina.ai.

Características

  • Extrae documentación de cualquier URL web
  • Convierte la documentación HTML al formato Markdown
  • Guarda la documentación convertida en una ruta de salida especificada
  • Se integra con el Protocolo de Contexto de Modelo (MCP)

Instalación

Instalación mediante herrería

Para instalar Doc Scraper para Claude Desktop automáticamente a través de Smithery :

npx -y @smithery/cli install @askjohngeorge/mcp-doc-scraper --client claude
  1. Clonar el repositorio:
git clone https://github.com/askjohngeorge/mcp-doc-scraper.git cd mcp-doc-scraper
  1. Crear y activar un entorno virtual:
python -m venv venv source venv/bin/activate # On Windows, use: venv\Scripts\activate
  1. Instalar las dependencias:
pip install -e .

Uso

El servidor se puede ejecutar usando Python:

python -m mcp_doc_scraper

Descripción de la herramienta

El servidor proporciona una única herramienta:

  • Nombre : scrape_docs
  • Descripción : Extraer documentación de una URL y guardarla como Markdown
  • Parámetros de entrada :
    • url : La URL de la documentación a raspar
    • output_path : La ruta donde se debe guardar el archivo markdown

Estructura del proyecto

doc_scraper/ ├── __init__.py ├── __main__.py └── server.py

Dependencias

  • aiohttp
  • mcp
  • pidantico

Desarrollo

Para configurar el entorno de desarrollo:

  1. Instalar dependencias de desarrollo:
pip install -r requirements.txt
  1. El servidor utiliza el Protocolo de Contexto de Modelo. Asegúrese de familiarizarse con la documentación de MCP .

Licencia

Licencia MIT

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

Convierte documentación basada en web al formato Markdown utilizando el servicio de conversión de jina.ai, lo que permite a los usuarios extraer documentación de cualquier URL y guardarla como archivos Markdown.

  1. Características
    1. Instalación
      1. Instalación mediante herrería
    2. Uso
      1. Descripción de la herramienta
    3. Estructura del proyecto
      1. Dependencias
        1. Desarrollo
          1. Licencia

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              Converts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.
              Last updated -
              10
              11
              1,966
              TypeScript
              MIT License
              • Apple
            • A
              security
              A
              license
              A
              quality
              This server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.
              Last updated -
              1
              10
              JavaScript
              MIT License
              • Apple
            • A
              security
              A
              license
              A
              quality
              A document conversion server that transforms various file formats (PDFs, documents, images, audio, web content) to Markdown with improved multilingual and UTF-8 support.
              Last updated -
              10
              2
              9
              TypeScript
              MIT License
              • Linux
              • Apple
            • A
              security
              F
              license
              A
              quality
              A server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.
              Last updated -
              1
              11
              33
              JavaScript
              • Linux
              • Apple

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/askjohngeorge/mcp-doc-scraper'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server