Skip to main content
Glama

PDF 문서 MCP 서버

By MEOK AI Labs | meok.ai

AI 에이전트를 위한 문서 처리 툴킷입니다. 외부 API 의존성 없이 로컬 환경에서 텍스트 추출, 마크다운 변환, PDF 병합, 표 추출 및 문서 요약 기능을 수행합니다.

도구

도구

설명

extract_text_from_pdf

PDF의 전체 또는 특정 페이지에서 텍스트 추출

convert_pdf_to_markdown

PDF를 제목 감지 기능이 포함된 구조화된 마크다운으로 변환

merge_pdfs

여러 PDF 파일을 하나의 문서로 병합

extract_tables

위치 분석을 사용하여 PDF 페이지에서 표 구조 추출

summarize_document

메타데이터, 통계, 제목 및 페이지별 요약 생성

설치

pip install mcp PyMuPDF

외부 서비스, API 키 또는 클라우드 의존성이 필요하지 않습니다. 모든 처리는 로컬에서 이루어집니다.

사용법

서버 실행

python server.py

Claude Desktop 설정

{
  "mcpServers": {
    "pdf-document": {
      "command": "python",
      "args": ["/path/to/pdf-document-mcp/server.py"]
    }
  }
}

호출 예시

PDF에서 텍스트 추출:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf"}
Output: {"total_pages": 12, "total_characters": 48320, "pages": [{"page": 1, "text": "...", "char_count": 4210}, ...]}

특정 페이지만 추출:

Tool: extract_text_from_pdf
Input: {"file_path": "/Users/me/documents/report.pdf", "pages": [1, 3, 5]}
Output: {"extracted_pages": 3, "pages": [...]}

PDF를 마크다운으로 변환:

Tool: convert_pdf_to_markdown
Input: {"file_path": "/Users/me/documents/whitepaper.pdf"}
Output: {"markdown": "# whitepaper.pdf\n\n---\n## Page 1\n\n### Introduction\n\nThis paper presents...", "char_count": 15200}

표 추출:

Tool: extract_tables
Input: {"file_path": "/Users/me/documents/financials.pdf", "page_num": 3}
Output: {"tables_found": 2, "tables": [{"header": ["Quarter", "Revenue", "Profit"], "rows": [["Q1", "$1.2M", "$400K"], ...]}]}

여러 PDF 병합:

Tool: merge_pdfs
Input: {"file_paths": ["/tmp/part1.pdf", "/tmp/part2.pdf", "/tmp/part3.pdf"], "output_path": "/tmp/combined.pdf"}
Output: {"output": "/tmp/combined.pdf", "total_pages": 28}

문서 요약:

Tool: summarize_document
Input: {"file_path": "/Users/me/documents/thesis.pdf"}
Output: {"statistics": {"total_pages": 45, "total_words": 12500, "total_images": 8}, "headings": [...], "metadata": {"author": "...", "title": "..."}}

가격

등급

제한

가격

무료

일일 20회 호출

$0

프로

무제한 + OCR 지원 + 일괄 처리

월 $9

엔터프라이즈

맞춤형 + 우선 지원

문의

라이선스

MIT

-
security - not tested
F
license - not found
-
quality - not tested

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/CSOAI-ORG/pdf-document-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server