Skip to main content
Glama

PDF Reader MCP Server

by trafflux

PDF 리더 MCP 서버

로컬 파일과 URL을 모두 지원하며 PDF 파일에서 텍스트를 읽고 추출하기 위한 도구를 제공하는 MCP(Model Context Protocol) 서버입니다.

작가

필립 반 드 워커
이메일: philip.vandewalker@gmail.com
GitHub: https://github.com/trafflux

특징

  • 로컬 PDF 파일에서 텍스트 콘텐츠 읽기
  • PDF URL에서 텍스트 콘텐츠 읽기
  • 손상되었거나 잘못된 PDF에 대한 오류 처리
  • 로컬 PDF에 액세스하기 위한 볼륨 마운팅
  • PDF 인코딩 자동 감지
  • 표준화된 JSON 출력 형식

설치

  1. 저장소를 복제합니다.

지엑스피1

  1. Docker 이미지를 빌드합니다.
docker build -t mcp/pdf-reader .

용법

서버 실행

로컬 PDF 파일에 액세스할 수 있는 서버를 실행하려면:

docker run -i --rm -v /path/to/pdfs:/pdfs mcp/pdf-reader

/path/to/pdfs PDF 파일 디렉토리의 실제 경로로 바꾸세요.

로컬 PDF 파일을 사용하지 않는 경우:

docker run -i --rm mcp/pdf-reader

MCP 구성

MCP 설정 구성에 다음을 추가합니다.

{ "mcpServers": { "pdf-reader": { "command": "docker", "args": [ "run", "-i", "--rm", "-v", "/path/to/pdfs:/pdfs", "mcp/pdf-reader" ], "disabled": false, "autoApprove": [] } } }

로컬 파일 PDF 파일 없음:

{ "mcpServers": { "pdf-reader": { "command": "docker", "args": ["run", "-i", "--rm", "mcp/pdf-reader"], "disabled": false, "autoApprove": [] } } }

사용 가능한 도구

  1. read_local_pdf
    • 목적: 로컬 PDF 파일에서 텍스트 콘텐츠 읽기
    • 입력:
      { "path": "/pdfs/document.pdf" }
    • 산출:
      { "success": true, "data": { "text": "Extracted content..." } }
  2. read_pdf_url
    • 목적: PDF URL에서 텍스트 콘텐츠 읽기
    • 입력:
      { "url": "https://example.com/document.pdf" }
    • 산출:
      { "success": true, "data": { "text": "Extracted content..." } }

오류 처리

서버는 다양한 오류 사례를 명확한 오류 메시지로 처리합니다.

  • 유효하지 않거나 손상된 PDF 파일
  • 누락된 파일
  • 실패한 URL 요청
  • 권한 문제
  • 네트워크 연결 문제

오류 응답은 다음 형식을 따릅니다.

{ "success": false, "error": "Detailed error message" }

종속성

  • 파이썬 3.11+
  • PyPDF2: PDF 구문 분석 및 텍스트 추출
  • 요청: URL에서 PDF를 가져오기 위한 HTTP 클라이언트
  • MCP SDK: 모델 컨텍스트 프로토콜 구현

프로젝트 구조

. ├── Dockerfile # Container configuration ├── README.md # This documentation ├── requirements.txt # Python dependencies └── src/ ├── __init__.py # Package initialization └── server.py # Main server implementation

특허

저작권 2025 필립 반 드 워커

Apache 라이선스 버전 2.0(이하 "라이선스")에 따라 라이선스가 부여되었습니다. 라이선스를 준수하지 않는 한 이 파일을 사용할 수 없습니다. 라이선스 사본은 다음 링크에서 확인하실 수 있습니다.

http://www.apache.org/licenses/LICENSE-2.0

관련 법률에 의해 요구되거나 서면으로 동의하지 않는 한, 라이선스에 따라 배포되는 소프트웨어는 명시적이든 묵시적이든 어떠한 종류의 보증이나 조건 없이 "있는 그대로" 배포됩니다. 라이선스에 따른 권한 및 제한 사항을 규정하는 구체적인 내용은 라이선스를 참조하십시오.

기여하다

기여를 환영합니다! 풀 리퀘스트를 제출해 주세요.

연락하다

질문, 문제 또는 기여 사항이 있으시면 Philip Van de Walker에게 연락해 주세요.

-
security - not tested
F
license - not found
-
quality - not tested

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

로컬 파일과 URL을 모두 지원하여 PDF 파일에서 텍스트를 읽고 추출하는 도구를 제공합니다.

  1. 작가
    1. 특징
      1. 설치
        1. 용법
          1. 서버 실행
          2. MCP 구성
          3. 사용 가능한 도구
        2. 오류 처리
          1. 종속성
            1. 프로젝트 구조
              1. 특허
                1. 기여하다
                  1. 연락하다

                    Related MCP Servers

                    • A
                      security
                      A
                      license
                      A
                      quality
                      Enables text extraction from web pages and PDFs, and execution of predefined commands, enhancing content processing and automation capabilities.
                      Last updated -
                      3
                      TypeScript
                      MIT License
                    • A
                      security
                      A
                      license
                      A
                      quality
                      Provides comprehensive document processing, including reading, converting, and manipulating various document formats with advanced text and HTML processing capabilities.
                      Last updated -
                      16
                      231
                      11
                      TypeScript
                      MIT License
                    • -
                      security
                      F
                      license
                      -
                      quality
                      A server providing PDF form manipulation tools via MCP's API, allowing users to find PDFs across directories, extract form field information, and visualize form fields in documents.
                      Last updated -
                      Python
                    • A
                      security
                      F
                      license
                      A
                      quality
                      An MCP server that provides a tool to extract text content from local PDF files, supporting both standard PDF reading and OCR capabilities with optional page selection.
                      Last updated -
                      1
                      6
                      Python
                      • Apple

                    View all related MCP servers

                    MCP directory API

                    We provide all the information about MCP servers via our MCP API.

                    curl -X GET 'https://glama.ai/api/mcp/v1/servers/trafflux/pdf-reader-mcp'

                    If you have feedback or need assistance with the MCP directory API, please join our Discord server