📄 MCP PDF 서버
FastMCP 기반의 PDF 파일 읽기 서버입니다.
MCP 프로토콜을 통해 PDF 텍스트 추출, OCR 인식 및 이미지 추출을 지원하며, 간편한 테스트를 위한 내장 웹 디버거가 포함되어 있습니다.
🚀 특징
- PDF 텍스트 읽기
PDF에서 일반 텍스트를 추출합니다(페이지별로). - OCR로 읽기
OCR을 사용하여 스캔한 PDF나 이미지 기반 PDF에서 텍스트를 인식합니다. - PDF 이미지 읽기
지정된 PDF 페이지에서 모든 이미지를 추출합니다(Base64로 인코딩된 출력).
📂 프로젝트 구조
지엑스피1
⚙️ 설치
권장 Python 버전: 3.9+
참고: OCR 기능을 사용하려면 OCR 지원이 있는 MuPDF 빌드나 외부 OCR 라이브러리가 필요할 수 있습니다.
🔦 서버 시작
다음 명령을 실행하세요.
다음과 같은 로그가 표시되어야 합니다.
🌐 웹 디버깅 인터페이스
브라우저를 열고 방문하세요.
- 왼쪽 패널에서 도구를 선택하세요
- 오른쪽 패널에 매개변수를 입력하세요
- 도구를 테스트하려면 "실행"을 클릭하세요.
코딩이 필요 없습니다. 웹 UI를 통해 쉽게 디버깅하고 테스트할 수 있습니다.
🛠️ API 도구 목록
도구 | 설명 | 입력 매개변수 | 보고 |
---|---|---|---|
read_pdf_text | PDF 페이지에서 일반 텍스트를 추출합니다. | file_path , start_page , end_page | 페이지 텍스트 목록 |
read_by_ocr | OCR을 통해 텍스트를 인식합니다 | file_path , start_page , end_page , language , dpi | OCR 추출된 텍스트 |
read_pdf_images | PDF 페이지에서 이미지를 추출합니다 | file_path , page_number | 이미지 목록(Base64 인코딩) |
📝 사용 예시
1~5페이지에서 텍스트 추출:
1페이지에서 OCR 인식을 수행합니다.
3페이지에서 모든 이미지를 추출합니다.
📢 참고사항
- 파일은
pdf_resources/
디렉토리에 넣어야 하며, 그렇지 않으면 절대 경로를 제공해야 합니다. - OCR 기능을 사용하려면 해당 환경에서 적절한 OCR 지원이 필요합니다.
- 대용량 파일을 처리할 때는 필요에 따라 메모리 및 시간 초과 설정을 조정하세요.
📜 라이센스
이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여되었습니다.
상업적으로 사용하는 경우, 원본 출처를 명시해 주시기 바랍니다.
This server cannot be installed
local-only server
The server can only run on the client's local machine because it depends on local resources.
일반 구문 분석이나 OCR을 통해 텍스트를 추출하고, 내장된 웹 디버거가 있는 MCP 프로토콜을 통해 PDF 파일에서 이미지를 검색하는 PDF 처리 서버입니다.
Related MCP Servers
- AsecurityFlicenseAqualityAn MCP server for converting Markdown documents to PDF files.Last updated -11JavaScript
- -securityFlicense-qualityProvides tools for reading and extracting text from PDF files, supporting both local files and URLs.Last updated -3Python
- -securityFlicense-qualityA server providing PDF form manipulation tools via MCP's API, allowing users to find PDFs across directories, extract form field information, and visualize form fields in documents.Last updated -Python
- AsecurityFlicenseAqualityA Model Context Protocol server that converts PDF documents into PNG images through a simple MCP tool call.Last updated -12Python