docxtpl MCP Server

RELEASE_NOTES_v0.3.0.md•4.86 KiB

# docxtpl-mcp v0.3.0 发布说明 ## 🎉 新功能：文档解析 (Document Parsing) 我们很高兴地宣布 docxtpl-mcp v0.3.0 版本发布！这个版本在原有的**文档生成**功能基础上，新增了强大的**文档解析**功能，形成完整的文档处理闭环。 --- ## ✨ 主要更新 ### 🆕 4 个新增 MCP 工具 #### 1. `parse_docx_document` 完整解析 DOCX 文档，提取结构化内容 **功能**: - 提取所有段落及其样式信息 - 提取表格完整数据 - 提取文档元数据（作者、标题、创建时间等） **参数**: ```json { "file_path": "/path/to/document.docx", "include_tables": true } ``` **输出**: 结构化 JSON，包含 metadata 和 content --- #### 2. `parse_pdf_document` 解析 PDF 文档，支持分页处理和表格提取 **功能**: - 高质量文本提取 - 自动表格识别和提取 - 分页解析（支持指定页面范围） - PDF 元数据提取 **参数**: ```json { "file_path": "/path/to/document.pdf", "include_tables": true, "pages": "1-10" // 或 "all" 或 "1,3,5" } ``` **输出**: 结构化 JSON，按页面组织内容 --- #### 3. `extract_text_from_document` 快速提取文档纯文本（支持 DOCX 和 PDF） **功能**: - 快速文本提取，不解析结构 - 自动文档格式检测 - 提供文本统计信息 **参数**: ```json { "file_path": "/path/to/document.docx" } ``` **输出**: 纯文本 + 统计信息（字符数、单词数、行数） --- #### 4. `get_document_metadata` 提取文档元信息 **功能**: - 文件基本信息（名称、大小、类型） - 文档属性（作者、标题、主题等） - 创建和修改时间 - 文档统计（页数/段落数/表格数等） **参数**: ```json { "file_path": "/path/to/document.pdf" } ``` **输出**: JSON 格式的完整元数据 --- ## 🔧 技术细节 ### 新增依赖 - `pdfplumber>=0.10.0` - PDF 文档解析 - `docx2txt>=0.8.0` - 快速文本提取 ### 核心特性 - ✅ 文件验证（存在性、格式、大小） - ✅ 结构化 JSON 输出 - ✅ 完善的错误处理 - ✅ 中文错误提示 - ✅ 支持大文件（最大 50MB） ### 性能 - DOCX 解析: < 1 秒 - PDF 解析: ~0.1 秒/页 - 文本提取: < 0.5 秒 --- ## 📦 安装和更新 ### 全局安装 ```bash npm install -g docxtpl-mcp@latest ``` ### 使用 npx（推荐） ```bash npx docxtpl-mcp@latest ``` ### 更新 Claude Desktop 配置 ```json { "mcpServers": { "docxtpl": { "command": "npx", "args": ["docxtpl-mcp@latest"] } } } ``` **重要**: 更新后需要重启 Claude Desktop 以加载新工具。 --- ## 🧪 测试 ### 运行演示脚本 ```bash # 克隆仓库 git clone https://github.com/yourusername/docxtpl-mcp.git cd docxtpl-mcp # 安装依赖 pip install -r requirements.txt # 运行演示 python3 demo_parsing.py ``` ### 本地测试 ```bash # 测试版本 npx docxtpl-mcp@latest --version # 输出: docxtpl-mcp v0.3.0 ``` --- ## 📊 功能对比 | 功能维度 | 文档生成 | 文档解析 | |---------|---------|---------| | **输入** | 模板 + 数据 | 文档文件 | | **输出** | Word 文档 | JSON 数据 | | **支持格式** | DOCX | DOCX + PDF | | **用途** | 自动化文档创建 | 内容提取分析 | --- ## 🚀 使用示例 ### 在 Claude Desktop 中使用 **用户**: "帮我解析这个 PDF 文件 `/Users/john/Documents/report.pdf`，提取所有文本和表格" **Claude**: ``` 好的，我来解析这个 PDF 文档... [调用 parse_pdf_document 工具] ✅ PDF 文档解析成功！ - 文件：report.pdf - 总页数：15 页 - 文本长度：12,450 字符 - 表格数：3 个解析结果已转换为结构化 JSON 格式。 ``` --- ## 🎯 使用场景 1. **文档内容提取**: 从现有文档中提取文本用于分析 2. **数据采集**: 批量提取 PDF 报告中的表格数据 3. **文档转换**: 将文档内容转换为结构化数据供 AI 处理 4. **元数据管理**: 提取和管理文档属性信息 5. **闭环工作流**: 生成 → 解析 → 分析 → 再生成 --- ## 🔗 相关链接 - **npm 包**: https://www.npmjs.com/package/docxtpl-mcp - **源代码**: https://github.com/yourusername/docxtpl-mcp - **问题反馈**: https://github.com/yourusername/docxtpl-mcp/issues - **文档**: [README.md](README.md) --- ## 📝 更新日志 ### v0.3.0 (2025-09-30) - ✨ 新增 4 个文档解析工具 - ✨ 支持 DOCX 和 PDF 文档解析 - ✨ 结构化 JSON 输出 - ✨ 表格自动识别和提取 - 🐛 优化错误处理 - 📝 更新文档 ### v0.2.2 (2025-09-28) - 初始版本，支持文档生成 --- ## 🙏 致谢感谢使用 docxtpl-mcp！如果您觉得这个项目有用，请给我们一个 ⭐ Star。 --- ## 💬 反馈遇到问题或有建议？欢迎： - 提交 Issue: https://github.com/yourusername/docxtpl-mcp/issues - 发送邮件: dev@docxtpl-mcp.io --- **🚀 Generated with [Claude Code](https://claude.com/claude-code)**

Loading blob content...

Latest Blog Posts

Redis vs ioredis vs valkey-glide
By punkpeye on January 26, 2026.
benchmark
Redis
valkey
Quickstart: Publish an MCP Server to the MCP Registry
By punkpeye on January 24, 2026.
mcp
official reference mirror
Official MCP Registry Server.json Requirements
By punkpeye on January 24, 2026.
mcp
official reference mirror

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/z1w2r3/doc-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server

RELEASE_NOTES_v0.3.0.md•4.86 KiB