Skip to main content
Glama

Doc Scraper MCP Server

Doc Scraper MCP 서버

문서 스크래핑 기능을 제공하는 모델 컨텍스트 프로토콜(MCP) 서버입니다. 이 서버는 jina.ai의 변환 서비스를 사용하여 웹 기반 문서를 마크다운 형식으로 변환합니다.

특징

  • 모든 웹 URL에서 문서를 스크랩합니다.
  • HTML 문서를 마크다운 형식으로 변환합니다.
  • 변환된 문서를 지정된 출력 경로에 저장합니다.
  • MCP(모델 컨텍스트 프로토콜)와 통합

설치

Smithery를 통해 설치

Smithery를 통해 Claude Desktop용 Doc Scraper를 자동으로 설치하려면:

지엑스피1

  1. 저장소를 복제합니다.
git clone https://github.com/askjohngeorge/mcp-doc-scraper.git cd mcp-doc-scraper
  1. 가상 환경을 만들고 활성화하세요.
python -m venv venv source venv/bin/activate # On Windows, use: venv\Scripts\activate
  1. 종속성을 설치합니다.
pip install -e .

용법

서버는 Python을 사용하여 실행할 수 있습니다.

python -m mcp_doc_scraper

도구 설명

서버는 단일 도구를 제공합니다.

  • 이름 : scrape_docs
  • 설명 : URL에서 문서를 스크래핑하여 마크다운으로 저장합니다.
  • 입력 매개변수 :
    • url : 스크래핑할 문서의 URL
    • output_path : 마크다운 파일을 저장할 경로

프로젝트 구조

doc_scraper/ ├── __init__.py ├── __main__.py └── server.py

종속성

  • aiohttp
  • 엠씨피
  • 피단틱

개발

개발 환경을 설정하려면:

  1. 개발 종속성 설치:
pip install -r requirements.txt
  1. 서버는 MCP(Model Context Protocol)를 사용합니다. MCP 설명서를 숙지하시기 바랍니다.

특허

MIT 라이센스

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

jina.ai의 변환 서비스를 사용하여 웹 기반 문서를 마크다운 형식으로 변환하고, 사용자는 모든 URL에서 문서를 스크래핑하여 마크다운 파일로 저장할 수 있습니다.

  1. 특징
    1. 설치
      1. Smithery를 통해 설치
    2. 용법
      1. 도구 설명
    3. 프로젝트 구조
      1. 종속성
        1. 개발
          1. 특허

            Related MCP Servers

            • A
              security
              A
              license
              A
              quality
              Converts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.
              Last updated -
              10
              11
              1,966
              TypeScript
              MIT License
              • Apple
            • A
              security
              A
              license
              A
              quality
              This server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.
              Last updated -
              1
              10
              JavaScript
              MIT License
              • Apple
            • A
              security
              A
              license
              A
              quality
              A document conversion server that transforms various file formats (PDFs, documents, images, audio, web content) to Markdown with improved multilingual and UTF-8 support.
              Last updated -
              10
              2
              9
              TypeScript
              MIT License
              • Linux
              • Apple
            • A
              security
              F
              license
              A
              quality
              A server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.
              Last updated -
              1
              11
              33
              JavaScript
              • Linux
              • Apple

            View all related MCP servers

            MCP directory API

            We provide all the information about MCP servers via our MCP API.

            curl -X GET 'https://glama.ai/api/mcp/v1/servers/askjohngeorge/mcp-doc-scraper'

            If you have feedback or need assistance with the MCP directory API, please join our Discord server