Skip to main content
Glama

주요 기능

  • 읽기 및 쓰기 통합: 문서를 읽을 뿐만 아니라 구조화된 매개변수를 기반으로 Word / PowerPoint 파일을 생성할 수 있습니다.

  • 광범위한 형식 지원: TXT, CSV, Markdown, DOC, DOCX, PDF, PPT, PPTX, EPUB, XLSX, XLS를 지원합니다.

  • 구조화된 작성: 단락, 표, 제목 페이지, 요점 페이지 및 프레젠테이션 표 생성을 지원합니다.

  • 구형 형식 내보내기 호환성: LibreOffice 설치 시 .doc.ppt로 내보낼 수 있습니다.

  • MCP 프로토콜: MCP 표준을 준수하며 AI 어시스턴트(예: Trae IDE)의 도구로 사용할 수 있습니다.

  • 쉬운 통합: 간단한 설정으로 즉시 사용 가능합니다.

  • 안정적인 성능: 읽기, 생성, 변환 폴백 및 도구 인터페이스에 대한 자동화된 테스트가 포함되어 있습니다.

  • 파일 시스템 지원: 파일 시스템에서 직접 문서를 읽고 쓸 수 있습니다.


📚 문서 센터

사용자 가이드 · API 참조 · 기여 가이드 · 변경 로그 · 라이선스


아키텍처

graph TB
    A[AI Assistant / User<br/>AI 助手 / 用户] -->|Call MCP tools<br/>调用 MCP 工具| B[MCP Document Reader<br/>MCP 文档读取器]
    B -->|Read<br/>读取| C[Document Readers<br/>文档读取器]
    B -->|Generate<br/>生成| D[Document Writers<br/>文档生成器]
    C -->|TXT / CSV / MD| E[Text-based Readers<br/>文本类读取器]
    C -->|DOC / DOCX| F[Word Readers<br/>Word 读取器]
    C -->|PPT / PPTX| G[Presentation Readers<br/>演示读取器]
    C -->|PDF / EPUB / Excel| H[Structured Readers<br/>结构化读取器]
    D -->|write_word_document| I[DOCX Builder<br/>DOCX 生成器]
    D -->|write_presentation| J[PPTX Builder<br/>PPTX 生成器]
    I -->|Optional conversion<br/>可选转换| K[LibreOffice -> DOC]
    J -->|Optional conversion<br/>可选转换| L[LibreOffice -> PPT]
    E --> M[Return text / metadata<br/>返回文本 / 元数据]
    F --> M
    G --> M
    H --> M
    K --> M
    L --> M
    M --> A
    
    style A fill:#e1f5ff
    style B fill:#fff4e1
    style C fill:#f0f0f0
    style D fill:#e8f5e9
    style E fill:#e8f5e9
    style F fill:#e8f5e9
    style G fill:#e8f5e9
    style H fill:#fff9c4

지원되는 형식

기능

형식

확장자

설명

읽기

텍스트

.txt

다중 인코딩 텍스트 추출 지원

읽기

CSV

.csv

탭으로 구분된 텍스트로 정규화

읽기

Markdown

.md, .markdown

Markdown 텍스트 직접 추출

읽기

Word

.doc, .docx

.doc는 명령 / LibreOffice 폴백을 통해 읽기

읽기

PDF

.pdf

텍스트 추출

읽기

PowerPoint

.ppt, .pptx

.pptx 네이티브 파싱, .ppt 폴백 읽기

읽기

EPUB

.epub

spine 순서에 따라 챕터 추출

읽기

Excel

.xlsx, .xls

워크시트 및 셀 내용 추출

생성

Word

.docx

네이티브 생성, 단락 및 표 지원

생성

Word

.doc

docx -> doc LibreOffice 변환을 통해 생성

생성

PowerPoint

.pptx

네이티브 생성, 제목, 본문, 요점, 표 지원

생성

PowerPoint

.ppt

pptx -> ppt LibreOffice 변환을 통해 생성

설치

pip 사용 (권장)

pip install mcp-documents-reader

PowerPoint 생성 기능이 필요한 경우, 실행 환경에서 python-pptx를 사용할 수 있는지 확인하십시오.

구형 형식인 .doc 또는 .ppt로 내보내야 하는 경우, LibreOffice를 설치하고 soffice 또는 libreofficePATH에 추가되었는지 확인하십시오.

소스 코드에서 설치

git clone https://github.com/xt765/mcp_documents_reader.git
cd mcp_documents_reader
pip install -e .

MCP 도구

본 서버는 다음 도구를 제공합니다:

read_document

통합 인터페이스를 사용하여 지원되는 모든 문서 유형을 읽습니다.

매개변수:

  • filename (string, 필수): 문서 파일 경로, 절대 경로 또는 상대 경로 지원.

extract_document_images

DOCX 파일에 포함된 이미지를 추출하고 구조화된 JSON 메타데이터를 반환합니다.

매개변수:

  • filename (string, 필수): DOCX 파일 경로.

  • output_dir (string, 선택): 이미지를 내보낼 디렉토리.

write_word_document

.docx Word 문서를 생성하거나 LibreOffice 변환을 통해 .doc로 내보냅니다.

매개변수:

  • filename (string, 필수): 출력 경로, 확장자는 반드시 .docx 또는 .doc여야 합니다.

  • title (string, 선택): 문서 제목.

  • paragraphs (string 배열, 선택): 순서대로 작성할 단락.

  • tables (object 배열, 선택): 표 정의, title, headers, rows 지원.

write_presentation

.pptx 프레젠테이션을 생성하거나 LibreOffice 변환을 통해 .ppt로 내보냅니다.

매개변수:

  • filename (string, 필수): 출력 경로, 확장자는 반드시 .pptx 또는 .ppt여야 합니다.

  • title (string, 선택): 제목 페이지 제목.

  • subtitle (string, 선택): 제목 페이지 부제목.

  • slides (object 배열, 선택): 슬라이드 정의, title, paragraphs, bullets, table 지원.

설정

Trae IDE / Claude Desktop에서 사용

MCP 설정 파일에 다음 내용을 추가하십시오:

옵션 1: PyPI 사용 (권장)

{
  "mcpServers": {
    "mcp-document-reader": {
      "command": "uvx",
      "args": [
        "mcp-documents-reader"
      ]
    }
  }
}

옵션 2: GitHub 저장소 사용

{
  "mcpServers": {
    "mcp-document-reader": {
      "command": "uvx",
      "args": [
        "--from",
        "git+https://github.com/xt765/mcp_documents_reader",
        "mcp_documents_reader"
      ]
    }
  }
}

옵션 3: Gitee 저장소 사용 (중국 내 접근 속도 향상)

{
  "mcpServers": {
    "mcp-document-reader": {
      "command": "uvx",
      "args": [
        "--from",
        "git+https://gitee.com/xt765/mcp_documents_reader",
        "mcp_documents_reader"
      ]
    }
  }
}

사용 방법

MCP 도구로 사용

설정이 완료되면 AI 어시스턴트가 다음 도구를 직접 호출할 수 있습니다:

# 读取 DOCX 文件
read_document(filename="example.docx")

# 读取演示文稿
read_document(filename="example.pptx")

# 生成 DOCX 报告
write_word_document(
    filename="report.docx",
    title="周报",
    paragraphs=["本周总结", "下周计划"],
    tables=[
        {
            "title": "指标表",
            "headers": ["名称", "数值"],
            "rows": [["线索", 42], ["成交", 8]],
        }
    ],
)

# 生成 PPTX 汇报
write_presentation(
    filename="briefing.pptx",
    title="季度汇报",
    subtitle="Q2",
    slides=[
        {
            "title": "亮点",
            "paragraphs": ["概述段落"],
            "bullets": ["重点 A", "重点 B"],
        }
    ],
)

Python 라이브러리로 사용

from mcp_documents_reader import DocumentReaderFactory

# 使用工厂类(推荐)
reader = DocumentReaderFactory.get_reader("document.pdf")
content = reader.read("/path/to/document.pdf")

# 检查格式是否支持
if DocumentReaderFactory.is_supported("file.xlsx"):
    reader = DocumentReaderFactory.get_reader("file.xlsx")
    content = reader.read("/path/to/file.xlsx")

도구 인터페이스 세부 정보

read_document

지원되는 모든 문서 유형을 읽습니다.

매개변수

유형

필수

설명

filename

string

문서 파일 경로, 절대 경로 또는 상대 경로 지원

extract_document_images

DOCX 파일에 포함된 이미지를 추출합니다.

매개변수

유형

필수

설명

filename

string

DOCX 파일 경로

output_dir

string

선택적 이미지 내보내기 디렉토리

write_word_document

DOCX를 직접 생성하거나 LibreOffice 변환을 통해 DOC로 내보냅니다.

매개변수

유형

필수

설명

filename

string

출력 경로, 확장자는 반드시 .docx 또는 .doc여야 함

title

string

선택적 문서 제목

paragraphs

string[]

순서대로 작성할 단락

tables

object[]

표 정의, title, headers, rows 지원

write_presentation

PPTX를 직접 생성하거나 LibreOffice 변환을 통해 PPT로 내보냅니다.

매개변수

유형

필수

설명

filename

string

출력 경로, 확장자는 반드시 .pptx 또는 .ppt여야 함

title

string

제목 페이지 제목

subtitle

string

제목 페이지 부제목

slides

object[]

슬라이드 정의, title, paragraphs, bullets, table 지원

의존성

핵심 의존성

  • mcp >= 1.26.0 - MCP 프로토콜 구현

  • python-docx >= 1.2.0 - DOCX 읽기 및 Word 문서 생성

  • python-pptx >= 0.6.23 - PowerPoint 문서 생성

  • pypdf >= 6.8.0 - PDF 파일 읽기 (PyPDF2 대체)

  • openpyxl >= 3.1.5 - Excel 파일 읽기

선택적 런타임 의존성

  • LibreOffice - 구형 형식 .doc 또는 .ppt로 내보내려면 필수 설치

  • antiword / catppt - 구형 형식 .doc / .ppt 읽기 시 선택적 보조 명령

개발 의존성

  • pytest >= 8.0.0 - 테스트 프레임워크

  • pytest-asyncio >= 0.24.0 - 비동기 테스트 지원

  • pytest-cov >= 6.0.0 - 커버리지 보고서

  • basedpyright >= 0.28.0 - 타입 체크

  • ruff >= 0.8.0 - 코드 검사 및 포맷팅

라이선스

본 프로젝트는 MIT 라이선스 하에 오픈 소스로 공개되었습니다.

본 프로젝트는 우수한 오픈 소스 프로젝트인 xt765/mcp_documents_reader를 기반으로 2차 개발되었으며, 이를 바탕으로 기능을 더욱 강화했습니다.

현재 주로 다음과 같은 기능을 추가 및 강화했습니다:

  • 문서 내 이미지 추출 기능

  • Word 및 PowerPoint 문서 작성 및 생성 워크플로우

  • MCP 시나리오를 위한 보다 완벽한 문서 작성 지원

원작자의 기초 기능 제공과 오픈 소스 활동에 깊이 감사드립니다.

기여

Issue 및 Pull Request 제출을 환영합니다!

관련 프로젝트

Install Server
A
security – no known vulnerabilities
A
license - permissive license
A
quality - A tier

Resources

Unclaimed servers have limited discoverability.

Looking for Admin?

If you are the server author, to access and configure the admin panel.

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/crispvibe/mcp-document-studio'

If you have feedback or need assistance with the MCP directory API, please join our Discord server