MCP Document Reader
주요 기능
읽기 및 쓰기 통합: 문서를 읽을 뿐만 아니라 구조화된 매개변수를 기반으로 Word / PowerPoint 파일을 생성할 수 있습니다.
광범위한 형식 지원: TXT, CSV, Markdown, DOC, DOCX, PDF, PPT, PPTX, EPUB, XLSX, XLS를 지원합니다.
구조화된 작성: 단락, 표, 제목 페이지, 요점 페이지 및 프레젠테이션 표 생성을 지원합니다.
구형 형식 내보내기 호환성: LibreOffice 설치 시
.doc및.ppt로 내보낼 수 있습니다.MCP 프로토콜: MCP 표준을 준수하며 AI 어시스턴트(예: Trae IDE)의 도구로 사용할 수 있습니다.
쉬운 통합: 간단한 설정으로 즉시 사용 가능합니다.
안정적인 성능: 읽기, 생성, 변환 폴백 및 도구 인터페이스에 대한 자동화된 테스트가 포함되어 있습니다.
파일 시스템 지원: 파일 시스템에서 직접 문서를 읽고 쓸 수 있습니다.
📚 문서 센터
사용자 가이드 · API 참조 · 기여 가이드 · 변경 로그 · 라이선스
아키텍처
graph TB
A[AI Assistant / User<br/>AI 助手 / 用户] -->|Call MCP tools<br/>调用 MCP 工具| B[MCP Document Reader<br/>MCP 文档读取器]
B -->|Read<br/>读取| C[Document Readers<br/>文档读取器]
B -->|Generate<br/>生成| D[Document Writers<br/>文档生成器]
C -->|TXT / CSV / MD| E[Text-based Readers<br/>文本类读取器]
C -->|DOC / DOCX| F[Word Readers<br/>Word 读取器]
C -->|PPT / PPTX| G[Presentation Readers<br/>演示读取器]
C -->|PDF / EPUB / Excel| H[Structured Readers<br/>结构化读取器]
D -->|write_word_document| I[DOCX Builder<br/>DOCX 生成器]
D -->|write_presentation| J[PPTX Builder<br/>PPTX 生成器]
I -->|Optional conversion<br/>可选转换| K[LibreOffice -> DOC]
J -->|Optional conversion<br/>可选转换| L[LibreOffice -> PPT]
E --> M[Return text / metadata<br/>返回文本 / 元数据]
F --> M
G --> M
H --> M
K --> M
L --> M
M --> A
style A fill:#e1f5ff
style B fill:#fff4e1
style C fill:#f0f0f0
style D fill:#e8f5e9
style E fill:#e8f5e9
style F fill:#e8f5e9
style G fill:#e8f5e9
style H fill:#fff9c4지원되는 형식
기능 | 형식 | 확장자 | 설명 |
읽기 | 텍스트 |
| 다중 인코딩 텍스트 추출 지원 |
읽기 | CSV |
| 탭으로 구분된 텍스트로 정규화 |
읽기 | Markdown |
| Markdown 텍스트 직접 추출 |
읽기 | Word |
|
|
읽기 |
| 텍스트 추출 | |
읽기 | PowerPoint |
|
|
읽기 | EPUB |
| spine 순서에 따라 챕터 추출 |
읽기 | Excel |
| 워크시트 및 셀 내용 추출 |
생성 | Word |
| 네이티브 생성, 단락 및 표 지원 |
생성 | Word |
|
|
생성 | PowerPoint |
| 네이티브 생성, 제목, 본문, 요점, 표 지원 |
생성 | PowerPoint |
|
|
설치
pip 사용 (권장)
pip install mcp-documents-readerPowerPoint 생성 기능이 필요한 경우, 실행 환경에서 python-pptx를 사용할 수 있는지 확인하십시오.
구형 형식인 .doc 또는 .ppt로 내보내야 하는 경우, LibreOffice를 설치하고 soffice 또는 libreoffice가 PATH에 추가되었는지 확인하십시오.
소스 코드에서 설치
git clone https://github.com/xt765/mcp_documents_reader.git
cd mcp_documents_reader
pip install -e .MCP 도구
본 서버는 다음 도구를 제공합니다:
read_document
통합 인터페이스를 사용하여 지원되는 모든 문서 유형을 읽습니다.
매개변수:
filename(string, 필수): 문서 파일 경로, 절대 경로 또는 상대 경로 지원.
extract_document_images
DOCX 파일에 포함된 이미지를 추출하고 구조화된 JSON 메타데이터를 반환합니다.
매개변수:
filename(string, 필수): DOCX 파일 경로.output_dir(string, 선택): 이미지를 내보낼 디렉토리.
write_word_document
.docx Word 문서를 생성하거나 LibreOffice 변환을 통해 .doc로 내보냅니다.
매개변수:
filename(string, 필수): 출력 경로, 확장자는 반드시.docx또는.doc여야 합니다.title(string, 선택): 문서 제목.paragraphs(string 배열, 선택): 순서대로 작성할 단락.tables(object 배열, 선택): 표 정의,title,headers,rows지원.
write_presentation
.pptx 프레젠테이션을 생성하거나 LibreOffice 변환을 통해 .ppt로 내보냅니다.
매개변수:
filename(string, 필수): 출력 경로, 확장자는 반드시.pptx또는.ppt여야 합니다.title(string, 선택): 제목 페이지 제목.subtitle(string, 선택): 제목 페이지 부제목.slides(object 배열, 선택): 슬라이드 정의,title,paragraphs,bullets,table지원.
설정
Trae IDE / Claude Desktop에서 사용
MCP 설정 파일에 다음 내용을 추가하십시오:
옵션 1: PyPI 사용 (권장)
{
"mcpServers": {
"mcp-document-reader": {
"command": "uvx",
"args": [
"mcp-documents-reader"
]
}
}
}옵션 2: GitHub 저장소 사용
{
"mcpServers": {
"mcp-document-reader": {
"command": "uvx",
"args": [
"--from",
"git+https://github.com/xt765/mcp_documents_reader",
"mcp_documents_reader"
]
}
}
}옵션 3: Gitee 저장소 사용 (중국 내 접근 속도 향상)
{
"mcpServers": {
"mcp-document-reader": {
"command": "uvx",
"args": [
"--from",
"git+https://gitee.com/xt765/mcp_documents_reader",
"mcp_documents_reader"
]
}
}
}사용 방법
MCP 도구로 사용
설정이 완료되면 AI 어시스턴트가 다음 도구를 직접 호출할 수 있습니다:
# 读取 DOCX 文件
read_document(filename="example.docx")
# 读取演示文稿
read_document(filename="example.pptx")
# 生成 DOCX 报告
write_word_document(
filename="report.docx",
title="周报",
paragraphs=["本周总结", "下周计划"],
tables=[
{
"title": "指标表",
"headers": ["名称", "数值"],
"rows": [["线索", 42], ["成交", 8]],
}
],
)
# 生成 PPTX 汇报
write_presentation(
filename="briefing.pptx",
title="季度汇报",
subtitle="Q2",
slides=[
{
"title": "亮点",
"paragraphs": ["概述段落"],
"bullets": ["重点 A", "重点 B"],
}
],
)Python 라이브러리로 사용
from mcp_documents_reader import DocumentReaderFactory
# 使用工厂类(推荐)
reader = DocumentReaderFactory.get_reader("document.pdf")
content = reader.read("/path/to/document.pdf")
# 检查格式是否支持
if DocumentReaderFactory.is_supported("file.xlsx"):
reader = DocumentReaderFactory.get_reader("file.xlsx")
content = reader.read("/path/to/file.xlsx")도구 인터페이스 세부 정보
read_document
지원되는 모든 문서 유형을 읽습니다.
매개변수 | 유형 | 필수 | 설명 |
filename | string | ✅ | 문서 파일 경로, 절대 경로 또는 상대 경로 지원 |
extract_document_images
DOCX 파일에 포함된 이미지를 추출합니다.
매개변수 | 유형 | 필수 | 설명 |
filename | string | ✅ | DOCX 파일 경로 |
output_dir | string | ❌ | 선택적 이미지 내보내기 디렉토리 |
write_word_document
DOCX를 직접 생성하거나 LibreOffice 변환을 통해 DOC로 내보냅니다.
매개변수 | 유형 | 필수 | 설명 |
filename | string | ✅ | 출력 경로, 확장자는 반드시 |
title | string | ❌ | 선택적 문서 제목 |
paragraphs | string[] | ❌ | 순서대로 작성할 단락 |
tables | object[] | ❌ | 표 정의, |
write_presentation
PPTX를 직접 생성하거나 LibreOffice 변환을 통해 PPT로 내보냅니다.
매개변수 | 유형 | 필수 | 설명 |
filename | string | ✅ | 출력 경로, 확장자는 반드시 |
title | string | ❌ | 제목 페이지 제목 |
subtitle | string | ❌ | 제목 페이지 부제목 |
slides | object[] | ❌ | 슬라이드 정의, |
의존성
핵심 의존성
mcp>= 1.26.0 - MCP 프로토콜 구현python-docx>= 1.2.0 - DOCX 읽기 및 Word 문서 생성python-pptx>= 0.6.23 - PowerPoint 문서 생성pypdf>= 6.8.0 - PDF 파일 읽기 (PyPDF2 대체)openpyxl>= 3.1.5 - Excel 파일 읽기
선택적 런타임 의존성
LibreOffice- 구형 형식.doc또는.ppt로 내보내려면 필수 설치antiword/catppt- 구형 형식.doc/.ppt읽기 시 선택적 보조 명령
개발 의존성
pytest>= 8.0.0 - 테스트 프레임워크pytest-asyncio>= 0.24.0 - 비동기 테스트 지원pytest-cov>= 6.0.0 - 커버리지 보고서basedpyright>= 0.28.0 - 타입 체크ruff>= 0.8.0 - 코드 검사 및 포맷팅
라이선스
본 프로젝트는 MIT 라이선스 하에 오픈 소스로 공개되었습니다.
본 프로젝트는 우수한 오픈 소스 프로젝트인 xt765/mcp_documents_reader를 기반으로 2차 개발되었으며, 이를 바탕으로 기능을 더욱 강화했습니다.
현재 주로 다음과 같은 기능을 추가 및 강화했습니다:
문서 내 이미지 추출 기능
Word 및 PowerPoint 문서 작성 및 생성 워크플로우
MCP 시나리오를 위한 보다 완벽한 문서 작성 지원
원작자의 기초 기능 제공과 오픈 소스 활동에 깊이 감사드립니다.
기여
Issue 및 Pull Request 제출을 환영합니다!
관련 프로젝트
MCP Document Converter - 다양한 형식 변환을 지원하는 MCP 문서 변환기
Model Context Protocol - 모델 컨텍스트 프로토콜 공식 문서
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/crispvibe/mcp-document-studio'
If you have feedback or need assistance with the MCP directory API, please join our Discord server