PDF 프로세서 MCP 서버
LaTeX 방정식 추출을 포함한 고급 기능을 갖춘 PDF 문서 처리를 위한 모델 컨텍스트 프로토콜(MCP) 서버입니다. Claude는 이 서버를 통해 LaTeX 수학 방정식을 포함한 PDF 문서에서 정보를 가져오고, 처리하고, 추출할 수 있습니다.
특징
- URL에서 PDF 가져오기
- PDF에서 텍스트 추출
- LaTeX 방정식 인식 및 추출
- MCP를 통한 Claude와의 통합
설치
표준 설치
지엑스피1
Claude Desktop/Claude Code 설치
Claude Desktop 또는 Claude Code와 함께 이 MCP 서버를 사용하려면:
- MCP CLI 도구가 아직 설치되지 않았다면 설치하세요.
- MCP CLI 도구를 사용하여 서버를 설치합니다.
mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
예를 들어, 이 저장소를 ~/mcp_pdf_processor
로 복제했다면:mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
- MCP 검사기를 사용한 개발을 위해:
mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
- Claude Desktop에서는 이제 다음 명령을 사용하여 대화에서 PDF_TOOLS 서버를 사용할 수 있습니다.
/mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
용법
독립 실행형 실행
python pdf_tool_server.py
환경 변수
OUTPUT_DIR
: 처리된 PDF를 저장할 디렉토리(기본값: llm_output
)PYTHONPATH
: mcp_pdf_processor 패키지가 포함된 디렉토리로 설정
Claude와 함께 사용
서버가 등록되면 Claude에게 다음 작업을 요청할 수 있습니다.
- "[URL]에서 PDF를 가져와 분석합니다."
- "[URL]의 PDF에서 LaTeX 방정식을 추출합니다."
- "[URL]의 PDF 내용을 요약하세요"
요구 사항
서버에는 다음과 같은 주요 종속성이 필요합니다.
- 파이썬 3.9 이상
pymupdf
: PDF 처리 및 텍스트 추출mcp
: 모델 컨텍스트 프로토콜 지원pydantic
: 데이터 검증 및 직렬화aiohttp
: 비동기 HTTP 클라이언트/서버torch
: LaTeX 방정식 추출용(선택 사항)pix2tex
: LaTeX 방정식 인식(선택 사항)
종속성 및 버전 요구 사항의 전체 목록은 pyproject.toml
참조하세요.
사용 예
다음은 Claude Desktop에서 PDF 프로세서를 사용하는 전체 워크플로의 예입니다.
# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522
# This returns a hash_id, which you'll use in the next step
# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
# This returns a filename for the processed output
# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>
# Now Claude can analyze the PDF content, including any LaTeX equations
특허
MIT