Skip to main content
Glama

PDF 프로세서 MCP 서버

LaTeX 방정식 추출을 포함한 고급 기능을 갖춘 PDF 문서 처리를 위한 모델 컨텍스트 프로토콜(MCP) 서버입니다. Claude는 이 서버를 통해 LaTeX 수학 방정식을 포함한 PDF 문서에서 정보를 가져오고, 처리하고, 추출할 수 있습니다.

특징

  • URL에서 PDF 가져오기

  • PDF에서 텍스트 추출

  • LaTeX 방정식 인식 및 추출

  • MCP를 통한 Claude와의 통합

Related MCP server: MCP Web Research Server

설치

표준 설치

지엑스피1

Claude Desktop/Claude Code 설치

Claude Desktop 또는 Claude Code와 함께 이 MCP 서버를 사용하려면:

  1. MCP CLI 도구가 아직 설치되지 않았다면 설치하세요.

    pip install "mcp[cli]"
  2. MCP CLI 도구를 사용하여 서버를 설치합니다.

    mcp install /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor

    예를 들어, 이 저장소를 ~/mcp_pdf_processor 로 복제했다면:

    mcp install ~/mcp_pdf_processor/pdf_tool_server.py --with-editable ~/mcp_pdf_processor
  3. MCP 검사기를 사용한 개발을 위해:

    mcp dev /path/to/pdf_tool_server.py --with-editable /path/to/mcp_pdf_processor
  4. Claude Desktop에서는 이제 다음 명령을 사용하여 대화에서 PDF_TOOLS 서버를 사용할 수 있습니다.

    /mcp PDF_TOOLS fetch_pdf url=https://example.com/document.pdf
    /mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true
    /mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

용법

독립 실행형 실행

python pdf_tool_server.py

환경 변수

  • OUTPUT_DIR : 처리된 PDF를 저장할 디렉토리(기본값: llm_output )

  • PYTHONPATH : mcp_pdf_processor 패키지가 포함된 디렉토리로 설정

Claude와 함께 사용

서버가 등록되면 Claude에게 다음 작업을 요청할 수 있습니다.

  • "[URL]에서 PDF를 가져와 분석합니다."

  • "[URL]의 PDF에서 LaTeX 방정식을 추출합니다."

  • "[URL]의 PDF 내용을 요약하세요"

요구 사항

서버에는 다음과 같은 주요 종속성이 필요합니다.

  • 파이썬 3.9 이상

  • pymupdf : PDF 처리 및 텍스트 추출

  • mcp : 모델 컨텍스트 프로토콜 지원

  • pydantic : 데이터 검증 및 직렬화

  • aiohttp : 비동기 HTTP 클라이언트/서버

  • torch : LaTeX 방정식 추출용(선택 사항)

  • pix2tex : LaTeX 방정식 인식(선택 사항)

종속성 및 버전 요구 사항의 전체 목록은 pyproject.toml 참조하세요.

사용 예

다음은 Claude Desktop에서 PDF 프로세서를 사용하는 전체 워크플로의 예입니다.

# 1. Fetch a PDF without reading it
/mcp PDF_TOOLS fetch_pdf url=https://arxiv.org/pdf/2505.05522

# This returns a hash_id, which you'll use in the next step

# 2. Process the PDF with LaTeX extraction
/mcp PDF_TOOLS process_pdf hash_id=<HASH_ID> extract_latex=true

# This returns a filename for the processed output

# 3. Read the processed content
/mcp PDF_TOOLS read_processed_pdf filename=<FILENAME>

# Now Claude can analyze the PDF content, including any LaTeX equations

특허

MIT

A
license - permissive license
-
quality - not tested
C
maintenance

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/MichaelLevinson/mcp_pdf_processor'

If you have feedback or need assistance with the MCP directory API, please join our Discord server