Skip to main content
Glama

mcp-pdf2md

MCP-PDF2MD

영어 | 중국어

MCP-PDF2MD 서비스

MinerU API를 기반으로 하는 MCP 기반 고성능 PDF-마크다운 변환 서비스로, 구조화된 출력을 통해 로컬 파일과 URL 링크에 대한 일괄 처리를 지원합니다.

주요 특징

  • 형식 변환: PDF 파일을 구조화된 마크다운 형식으로 변환합니다.
  • 다중 소스 지원: 로컬 PDF 파일과 URL 링크를 모두 처리합니다.
  • 지능형 처리: 최적의 처리 방법을 자동으로 선택합니다.
  • 일괄 처리: 대용량 PDF 파일을 효율적으로 처리하기 위해 여러 파일 일괄 변환을 지원합니다.
  • MCP 통합: Claude Desktop과 같은 LLM 클라이언트와 원활하게 통합됩니다.
  • 구조 보존: 제목, 문단, 목록 등을 포함한 원본 문서 구조를 유지합니다.
  • 스마트 레이아웃: 단일 열, 다중 열 및 복잡한 레이아웃에 적합하며 사람이 읽을 수 있는 순서로 텍스트를 출력합니다.
  • 수식 변환: 문서의 수식을 자동으로 인식하여 LaTeX 형식으로 변환합니다.
  • 표 추출: 문서의 표를 자동으로 인식하고 구조화된 형식으로 변환합니다.
  • 정리 최적화: 의미적 일관성을 보장하기 위해 머리글, 바닥글, 각주, 페이지 번호 등을 제거합니다.
  • 고품질 추출: PDF 문서에서 텍스트, 이미지, 레이아웃 정보를 고품질로 추출합니다.

시스템 요구 사항

  • 소프트웨어: Python 3.10+

빠른 시작

  1. 저장소를 복제하고 디렉토리로 들어갑니다.지엑스피1
  2. 가상 환경을 만들고 종속성을 설치합니다.리눅스/맥OS :
    uv venv source .venv/bin/activate uv pip install -e .
    윈도우 :
    uv venv .venv\Scripts\activate uv pip install -e .
  3. 환경 변수 구성:프로젝트 루트 디렉토리에 .env 파일을 만들고 다음 환경 변수를 설정합니다.
    MINERU_API_BASE=https://mineru.net/api/v4/extract/task MINERU_BATCH_API=https://mineru.net/api/v4/extract/task/batch MINERU_BATCH_RESULTS_API=https://mineru.net/api/v4/extract-results/batch MINERU_API_KEY=your_api_key_here
  4. 서비스 시작:
    uv run pdf2md

명령줄 인수

서버는 다음 명령줄 인수를 지원합니다.

클로드 데스크톱 구성

Claude Desktop에 다음 구성을 추가합니다.

윈도우 :

{ "mcpServers": { "pdf2md": { "command": "uv", "args": [ "--directory", "C:\\path\\to\\mcp-pdf2md", "run", "pdf2md", "--output-dir", "C:\\path\\to\\output" ], "env": { "MINERU_API_KEY": "your_api_key_here" } } } }

리눅스/맥OS :

{ "mcpServers": { "pdf2md": { "command": "uv", "args": [ "--directory", "/path/to/mcp-pdf2md", "run", "pdf2md", "--output-dir", "/path/to/output" ], "env": { "MINERU_API_KEY": "your_api_key_here" } } } }

API 키 구성에 대한 참고 사항: API 키는 두 가지 방법으로 설정할 수 있습니다.

  1. 프로젝트 디렉토리 내의 .env 파일에서(개발용으로 권장)
  2. 위에 표시된 Claude Desktop 구성(일반 사용 권장)

두 곳 모두에 API 키를 설정하는 경우, Claude Desktop 구성에 있는 API 키가 우선 적용됩니다.

MCP 도구

서버는 다음과 같은 MCP 도구를 제공합니다.

  • convert_pdf_url : PDF URL을 마크다운으로 변환
  • convert_pdf_file : 로컬 PDF 파일을 마크다운으로 변환

MinerU API 키 받기

이 프로젝트는 PDF 콘텐츠 추출을 위해 MinerU API를 사용합니다. API 키를 받으려면:

  1. MinerU 공식 웹사이트를 방문하여 계정을 등록하세요.
  2. 로그인 후, 이 링크 에서 API 테스팅 자격을 신청하세요.
  3. 신청서가 승인되면 API 관리 페이지에 액세스할 수 있습니다.
  4. 제공된 지침에 따라 API 키를 생성하세요.
  5. 생성된 API 키를 복사하세요
  6. 이 문자열을 MINERU_API_KEY 의 값으로 사용하세요.

MinerU API 이용은 현재 테스트 단계이며 MinerU 팀의 승인이 필요합니다. 승인 절차에 다소 시간이 걸릴 수 있으니, 이에 따라 계획을 세우시기 바랍니다.

데모

PDF 입력

PDF 입력

출력 마크다운

출력 마크다운

특허

MIT 라이센스 - 자세한 내용은 LICENSE 파일을 참조하세요.

크레딧

이 프로젝트는 MinerU 의 API를 기반으로 합니다.

-
security - not tested
A
license - permissive license
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

PDF를 마크다운으로 변환하는 도구

  1. MCP-PDF2MD 서비스
    1. 주요 특징
    2. 시스템 요구 사항
    3. 빠른 시작
    4. 명령줄 인수
    5. 클로드 데스크톱 구성
    6. MCP 도구
    7. MinerU API 키 받기
    8. 데모
    9. 특허
    10. 크레딧

Related MCP Servers

  • A
    security
    F
    license
    A
    quality
    An MCP server for converting Markdown documents to PDF files.
    Last updated -
    1
    1
    JavaScript
  • A
    security
    A
    license
    A
    quality
    Converts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.
    Last updated -
    10
    2
    1,611
    TypeScript
    MIT License
    • Apple
  • A
    security
    A
    license
    A
    quality
    Converts various file formats to Markdown using the MarkItDown utility and can be integrated with MCP clients for seamless document processing and conversion.
    Last updated -
    26
    Python
    MIT License
  • -
    security
    F
    license
    -
    quality
    Converts Markdown to styled PDFs using VS Code's markdown styling and Python's ReportLab, providing a simple note storage system with custom URI scheme.
    Last updated -
    6
    Python
    • Apple

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/FutureUnreal/mcp-pdf2md'

If you have feedback or need assistance with the MCP directory API, please join our Discord server