Skip to main content
Glama

docxtpl MCP Server

by z1w2r3
RELEASE_NOTES_v0.3.0.md4.97 kB
# docxtpl-mcp v0.3.0 发布说明 ## 🎉 新功能:文档解析 (Document Parsing) 我们很高兴地宣布 docxtpl-mcp v0.3.0 版本发布!这个版本在原有的**文档生成**功能基础上,新增了强大的**文档解析**功能,形成完整的文档处理闭环。 --- ## ✨ 主要更新 ### 🆕 4 个新增 MCP 工具 #### 1. `parse_docx_document` 完整解析 DOCX 文档,提取结构化内容 **功能**: - 提取所有段落及其样式信息 - 提取表格完整数据 - 提取文档元数据(作者、标题、创建时间等) **参数**: ```json { "file_path": "/path/to/document.docx", "include_tables": true } ``` **输出**: 结构化 JSON,包含 metadata 和 content --- #### 2. `parse_pdf_document` 解析 PDF 文档,支持分页处理和表格提取 **功能**: - 高质量文本提取 - 自动表格识别和提取 - 分页解析(支持指定页面范围) - PDF 元数据提取 **参数**: ```json { "file_path": "/path/to/document.pdf", "include_tables": true, "pages": "1-10" // 或 "all" 或 "1,3,5" } ``` **输出**: 结构化 JSON,按页面组织内容 --- #### 3. `extract_text_from_document` 快速提取文档纯文本(支持 DOCX 和 PDF) **功能**: - 快速文本提取,不解析结构 - 自动文档格式检测 - 提供文本统计信息 **参数**: ```json { "file_path": "/path/to/document.docx" } ``` **输出**: 纯文本 + 统计信息(字符数、单词数、行数) --- #### 4. `get_document_metadata` 提取文档元信息 **功能**: - 文件基本信息(名称、大小、类型) - 文档属性(作者、标题、主题等) - 创建和修改时间 - 文档统计(页数/段落数/表格数等) **参数**: ```json { "file_path": "/path/to/document.pdf" } ``` **输出**: JSON 格式的完整元数据 --- ## 🔧 技术细节 ### 新增依赖 - `pdfplumber>=0.10.0` - PDF 文档解析 - `docx2txt>=0.8.0` - 快速文本提取 ### 核心特性 - ✅ 文件验证(存在性、格式、大小) - ✅ 结构化 JSON 输出 - ✅ 完善的错误处理 - ✅ 中文错误提示 - ✅ 支持大文件(最大 50MB) ### 性能 - DOCX 解析: < 1 秒 - PDF 解析: ~0.1 秒/页 - 文本提取: < 0.5 秒 --- ## 📦 安装和更新 ### 全局安装 ```bash npm install -g docxtpl-mcp@latest ``` ### 使用 npx(推荐) ```bash npx docxtpl-mcp@latest ``` ### 更新 Claude Desktop 配置 ```json { "mcpServers": { "docxtpl": { "command": "npx", "args": ["docxtpl-mcp@latest"] } } } ``` **重要**: 更新后需要重启 Claude Desktop 以加载新工具。 --- ## 🧪 测试 ### 运行演示脚本 ```bash # 克隆仓库 git clone https://github.com/yourusername/docxtpl-mcp.git cd docxtpl-mcp # 安装依赖 pip install -r requirements.txt # 运行演示 python3 demo_parsing.py ``` ### 本地测试 ```bash # 测试版本 npx docxtpl-mcp@latest --version # 输出: docxtpl-mcp v0.3.0 ``` --- ## 📊 功能对比 | 功能维度 | 文档生成 | 文档解析 | |---------|---------|---------| | **输入** | 模板 + 数据 | 文档文件 | | **输出** | Word 文档 | JSON 数据 | | **支持格式** | DOCX | DOCX + PDF | | **用途** | 自动化文档创建 | 内容提取分析 | --- ## 🚀 使用示例 ### 在 Claude Desktop 中使用 **用户**: "帮我解析这个 PDF 文件 `/Users/john/Documents/report.pdf`,提取所有文本和表格" **Claude**: ``` 好的,我来解析这个 PDF 文档... [调用 parse_pdf_document 工具] ✅ PDF 文档解析成功! - 文件:report.pdf - 总页数:15 页 - 文本长度:12,450 字符 - 表格数:3 个 解析结果已转换为结构化 JSON 格式。 ``` --- ## 🎯 使用场景 1. **文档内容提取**: 从现有文档中提取文本用于分析 2. **数据采集**: 批量提取 PDF 报告中的表格数据 3. **文档转换**: 将文档内容转换为结构化数据供 AI 处理 4. **元数据管理**: 提取和管理文档属性信息 5. **闭环工作流**: 生成 → 解析 → 分析 → 再生成 --- ## 🔗 相关链接 - **npm 包**: https://www.npmjs.com/package/docxtpl-mcp - **源代码**: https://github.com/yourusername/docxtpl-mcp - **问题反馈**: https://github.com/yourusername/docxtpl-mcp/issues - **文档**: [README.md](README.md) --- ## 📝 更新日志 ### v0.3.0 (2025-09-30) - ✨ 新增 4 个文档解析工具 - ✨ 支持 DOCX 和 PDF 文档解析 - ✨ 结构化 JSON 输出 - ✨ 表格自动识别和提取 - 🐛 优化错误处理 - 📝 更新文档 ### v0.2.2 (2025-09-28) - 初始版本,支持文档生成 --- ## 🙏 致谢 感谢使用 docxtpl-mcp!如果您觉得这个项目有用,请给我们一个 ⭐ Star。 --- ## 💬 反馈 遇到问题或有建议?欢迎: - 提交 Issue: https://github.com/yourusername/docxtpl-mcp/issues - 发送邮件: dev@docxtpl-mcp.io --- **🚀 Generated with [Claude Code](https://claude.com/claude-code)**

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/z1w2r3/doc-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server