MCP-PDF2MD
MCP-PDF2MD 서비스
MinerU API를 기반으로 하는 MCP 기반 고성능 PDF-마크다운 변환 서비스로, 구조화된 출력을 통해 로컬 파일과 URL 링크에 대한 일괄 처리를 지원합니다.
주요 특징
- 형식 변환: PDF 파일을 구조화된 마크다운 형식으로 변환합니다.
- 다중 소스 지원: 로컬 PDF 파일과 URL 링크를 모두 처리합니다.
- 지능형 처리: 최적의 처리 방법을 자동으로 선택합니다.
- 일괄 처리: 대용량 PDF 파일을 효율적으로 처리하기 위해 여러 파일 일괄 변환을 지원합니다.
- MCP 통합: Claude Desktop과 같은 LLM 클라이언트와 원활하게 통합됩니다.
- 구조 보존: 제목, 문단, 목록 등을 포함한 원본 문서 구조를 유지합니다.
- 스마트 레이아웃: 단일 열, 다중 열 및 복잡한 레이아웃에 적합하며 사람이 읽을 수 있는 순서로 텍스트를 출력합니다.
- 수식 변환: 문서의 수식을 자동으로 인식하여 LaTeX 형식으로 변환합니다.
- 표 추출: 문서의 표를 자동으로 인식하고 구조화된 형식으로 변환합니다.
- 정리 최적화: 의미적 일관성을 보장하기 위해 머리글, 바닥글, 각주, 페이지 번호 등을 제거합니다.
- 고품질 추출: PDF 문서에서 텍스트, 이미지, 레이아웃 정보를 고품질로 추출합니다.
시스템 요구 사항
- 소프트웨어: Python 3.10+
빠른 시작
- 저장소를 복제하고 디렉토리로 들어갑니다.지엑스피1
- 가상 환경을 만들고 종속성을 설치합니다.리눅스/맥OS :윈도우 :
- 환경 변수 구성:프로젝트 루트 디렉토리에
.env
파일을 만들고 다음 환경 변수를 설정합니다. - 서비스 시작:
명령줄 인수
서버는 다음 명령줄 인수를 지원합니다.
클로드 데스크톱 구성
Claude Desktop에 다음 구성을 추가합니다.
윈도우 :
리눅스/맥OS :
API 키 구성에 대한 참고 사항: API 키는 두 가지 방법으로 설정할 수 있습니다.
- 프로젝트 디렉토리 내의
.env
파일에서(개발용으로 권장) - 위에 표시된 Claude Desktop 구성(일반 사용 권장)
두 곳 모두에 API 키를 설정하는 경우, Claude Desktop 구성에 있는 API 키가 우선 적용됩니다.
MCP 도구
서버는 다음과 같은 MCP 도구를 제공합니다.
- convert_pdf_url : PDF URL을 마크다운으로 변환
- convert_pdf_file : 로컬 PDF 파일을 마크다운으로 변환
MinerU API 키 받기
이 프로젝트는 PDF 콘텐츠 추출을 위해 MinerU API를 사용합니다. API 키를 받으려면:
- MinerU 공식 웹사이트를 방문하여 계정을 등록하세요.
- 로그인 후, 이 링크 에서 API 테스팅 자격을 신청하세요.
- 신청서가 승인되면 API 관리 페이지에 액세스할 수 있습니다.
- 제공된 지침에 따라 API 키를 생성하세요.
- 생성된 API 키를 복사하세요
- 이 문자열을
MINERU_API_KEY
의 값으로 사용하세요.
MinerU API 이용은 현재 테스트 단계이며 MinerU 팀의 승인이 필요합니다. 승인 절차에 다소 시간이 걸릴 수 있으니, 이에 따라 계획을 세우시기 바랍니다.
데모
PDF 입력
출력 마크다운
특허
MIT 라이센스 - 자세한 내용은 LICENSE 파일을 참조하세요.
크레딧
이 프로젝트는 MinerU 의 API를 기반으로 합니다.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
PDF를 마크다운으로 변환하는 도구
Related MCP Servers
- AsecurityFlicenseAqualityAn MCP server for converting Markdown documents to PDF files.Last updated -11JavaScript
- AsecurityAlicenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1021,611TypeScriptMIT License
- AsecurityAlicenseAqualityConverts various file formats to Markdown using the MarkItDown utility and can be integrated with MCP clients for seamless document processing and conversion.Last updated -26PythonMIT License
- -securityFlicense-qualityConverts Markdown to styled PDFs using VS Code's markdown styling and Python's ReportLab, providing a simple note storage system with custom URI scheme.Last updated -6Python