
Doc Scraper MCP 서버
문서 스크래핑 기능을 제공하는 모델 컨텍스트 프로토콜(MCP) 서버입니다. 이 서버는 jina.ai의 변환 서비스를 사용하여 웹 기반 문서를 마크다운 형식으로 변환합니다.
특징
모든 웹 URL에서 문서를 스크랩합니다.
HTML 문서를 마크다운 형식으로 변환합니다.
변환된 문서를 지정된 출력 경로에 저장합니다.
MCP(모델 컨텍스트 프로토콜)와 통합
설치
Smithery를 통해 설치
Smithery를 통해 Claude Desktop용 Doc Scraper를 자동으로 설치하려면:
지엑스피1
저장소를 복제합니다.
가상 환경을 만들고 활성화하세요.
종속성을 설치합니다.
용법
서버는 Python을 사용하여 실행할 수 있습니다.
도구 설명
서버는 단일 도구를 제공합니다.
이름 :
scrape_docs설명 : URL에서 문서를 스크래핑하여 마크다운으로 저장합니다.
입력 매개변수 :
url: 스크래핑할 문서의 URLoutput_path: 마크다운 파일을 저장할 경로
프로젝트 구조
종속성
aiohttp
엠씨피
피단틱
개발
개발 환경을 설정하려면:
개발 종속성 설치:
서버는 MCP(Model Context Protocol)를 사용합니다. MCP 설명서를 숙지하시기 바랍니다.
특허
MIT 라이센스
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
jina.ai의 변환 서비스를 사용하여 웹 기반 문서를 마크다운 형식으로 변환하고, 사용자는 모든 URL에서 문서를 스크래핑하여 마크다운 파일로 저장할 수 있습니다.
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1072,163MIT License
 - Asecurity-licenseAqualityA document conversion server that transforms various file formats (PDFs, documents, images, audio, web content) to Markdown with improved multilingual and UTF-8 support.Last updated -10110MIT License
 - Asecurity-licenseAqualityA server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.Last updated -1434
 - Asecurity-licenseAqualityFast, token-efficient web content extraction tool that converts websites to clean Markdown for AI agents, featuring smart caching, content extraction with Mozilla Readability, and polite crawling capabilities.Last updated -114891MIT License