Skip to main content
Glama

📄 MCP PDF 서버

FastMCP 기반의 PDF 파일 읽기 서버입니다.

MCP 프로토콜을 통해 PDF 텍스트 추출, OCR 인식 및 이미지 추출을 지원하며, 간편한 테스트를 위한 내장 웹 디버거가 포함되어 있습니다.


🚀 특징

  • PDF 텍스트 읽기
    PDF에서 일반 텍스트를 추출합니다(페이지별로).

  • OCR로 읽기
    OCR을 사용하여 스캔한 PDF나 이미지 기반 PDF에서 텍스트를 인식합니다.

  • PDF 이미지 읽기
    지정된 PDF 페이지에서 모든 이미지를 추출합니다(Base64로 인코딩된 출력).


Related MCP server: Textin MCP Server

📂 프로젝트 구조

지엑스피1


⚙️ 설치

권장 Python 버전: 3.9+

pip install pymupdf mcp

참고: OCR 기능을 사용하려면 OCR 지원이 있는 MuPDF 빌드나 외부 OCR 라이브러리가 필요할 수 있습니다.


🔦 서버 시작

다음 명령을 실행하세요.

python txt_server.py

다음과 같은 로그가 표시되어야 합니다.

Serving on http://127.0.0.1:6231

🌐 웹 디버깅 인터페이스

브라우저를 열고 방문하세요.

http://127.0.0.1:6231
  • 왼쪽 패널에서 도구를 선택하세요

  • 오른쪽 패널에 매개변수를 입력하세요

  • 도구를 테스트하려면 "실행"을 클릭하세요.

코딩이 필요 없습니다. 웹 UI를 통해 쉽게 디버깅하고 테스트할 수 있습니다.


🛠️ API 도구 목록

도구

설명

입력 매개변수

보고

read_pdf_text

PDF 페이지에서 일반 텍스트를 추출합니다.

file_path , start_page , end_page

페이지 텍스트 목록

read_by_ocr

OCR을 통해 텍스트를 인식합니다

file_path , start_page , end_page , language , dpi

OCR 추출된 텍스트

read_pdf_images

PDF 페이지에서 이미지를 추출합니다

file_path , page_number

이미지 목록(Base64 인코딩)


📝 사용 예시

1~5페이지에서 텍스트 추출:

mcp run read_pdf_text --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 5}'

1페이지에서 OCR 인식을 수행합니다.

mcp run read_by_ocr --args '{"file_path": "pdf_resources/example.pdf", "start_page": 1, "end_page": 1, "language": "eng"}'

3페이지에서 모든 이미지를 추출합니다.

mcp run read_pdf_images --args '{"file_path": "pdf_resources/example.pdf", "page_number": 3}'

📢 참고사항

  • 파일은 pdf_resources/ 디렉토리에 넣어야 하며, 그렇지 않으면 절대 경로를 제공해야 합니다.

  • OCR 기능을 사용하려면 해당 환경에서 적절한 OCR 지원이 필요합니다.

  • 대용량 파일을 처리할 때는 필요에 따라 메모리 및 시간 초과 설정을 조정하세요.


📜 라이센스

이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여되었습니다.
상업적으로 사용하는 경우, 원본 출처를 명시해 주시기 바랍니다.


-
security - not tested
F
license - not found
-
quality - not tested

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/DeepSeekMine/mcp-pdf-reader'

If you have feedback or need assistance with the MCP directory API, please join our Discord server