readme.md•6.2 kB
# MCP Word文档处理工具 🤖
专为AI设计的Word文档处理MCP(Model Context Protocol)工具服务器,为AI助手提供强大的Word文档操作能力。支持大数据量表格处理和复杂文档格式化。
## ✨ 核心特性
- **🚀 高性能处理** - 支持大数据量表格(50+行×15+列)
- **🎨 富文本格式** - 多级标题、字体样式、颜色设置
- **📊 智能表格** - 自动格式化、专业布局
- **🔄 批量操作** - 文本替换、格式转换
- **🌏 中文友好** - 完美支持中文字符和段落
## 🎯 主要功能
### 📄 文档创建与管理
- **创建文档** - 支持多段落、换行符处理
- **读取文档** - 多种格式输出(Text/HTML/Markdown)
- **文本替换** - 精确查找替换功能
### 🎨 高级格式化
- **格式化文档** - 字体、大小、颜色、样式设置
- **多级标题** - 自动层级管理和编号
- **段落控制** - 对齐方式、行间距设置
### 📊 表格处理专家
- **大数据表格** - 支持50+行×15+列复杂表格
- **自动格式化** - 表头加粗、边框样式、列宽调整
- **数据类型支持** - 文本、数字、百分比、评级
## 🛠 MCP工具列表
### 1. create_docx
创建新的Word文档
```json
{
"fileName": "示例文档",
"title": "文档标题",
"content": "支持多段落内容\n\n第二段内容"
}
```
### 2. read_docx
读取Word文档内容
```json
{
"filePath": "output/文档名.docx",
"format": "text" // text|html|markdown
}
```
### 3. replace_text_in_docx
文档文本替换
```json
{
"filePath": "output/原文档.docx",
"searchText": "旧文本",
"replaceText": "新文本",
"outputFileName": "更新后文档"
}
```
### 4. create_formatted_docx
创建格式化文档
```json
{
"fileName": "格式化文档",
"title": "报告标题",
"contentArray": [
{"text": "一级标题", "bold": true, "fontSize": 18, "color": "blue"},
{"text": "正文内容", "fontSize": 12}
]
}
```
### 5. create_table_in_docx
创建表格文档(支持大数据量)
```json
{
"fileName": "数据表格",
"title": "统计报告",
"tableData": {
"headers": ["项目", "数值", "状态"],
"rows": [
["项目A", "100", "完成"],
["项目B", "85", "进行中"]
]
}
}
```
## 🚀 快速开始
### 环境要求
- Node.js 18.0+
- npm 或 yarn
### 安装和启动
```bash
# 安装依赖
npm install
# 启动服务器
cd src && node server.js
```
### 服务端点
- **MCP协议**: `http://localhost:3500/mcp`
- **管理界面**: `http://localhost:3500`
- **端口**: 3500
## 🎮 AI专用界面
访问 `http://localhost:3500` 查看AI专用功能展示界面:
- **功能文档** - 完整的API参数说明
- **使用示例** - JSON格式的调用样例
- **服务状态** - 实时监控MCP服务器状态
- **技术规格** - 支持的格式和特性列表
## 💪 大数据处理能力
### 已验证的处理规模
- ✅ **员工绩效表**: 25行×15列(9.4KB)
- ✅ **销售业绩表**: 50行×15列(11KB)
- ✅ **AI技术报告**: 5000字长文档(11KB)
- ✅ **格式化文档**: 多级标题+富文本(11KB)
### 性能表现
- **处理速度**: 59,761字符/秒
- **支持格式**: .docx、文本、HTML、Markdown
- **中文支持**: 完美支持中文字符和段落
- **内存效率**: 优化的流式处理
## 🔧 Cursor IDE集成
在Cursor设置中添加MCP配置:
```json
{
"mcp.servers": {
"word-tools": {
"command": "node",
"args": ["/path/to/MCP工具/src/server.js"],
"env": {}
}
}
}
```
### AI使用示例
在Cursor中直接对AI说:
```
请创建一个员工绩效表格,包含25个员工的详细数据,包含姓名、部门、绩效评分等15个字段。
```
```
帮我读取刚才创建的表格文档,并总结一下员工的绩效分布情况。
```
```
创建一个5000字的AI技术发展报告,包含多级标题和格式化内容。
```
## 📂 项目结构
```
MCP工具/
├── src/
│ ├── server.js # MCP服务器主文件
│ └── docxHandler.js # Word文档处理核心
├── public/
│ └── index.html # AI专用展示界面
├── documents/
│ ├── output/ # 生成的文档目录
│ └── templates/ # 文档模板
├── config/ # 配置文件
├── scripts/ # 工具脚本
├── test/ # 测试文件
├── package.json
└── readme.md
```
## 📊 成功案例
### 1. 企业数据报表
- **25行员工绩效数据** - 完整的HR管理表格
- **50行销售业绩统计** - 全国销售数据分析
- **多维度数据展示** - 支持15+列复杂数据结构
### 2. 学术文档
- **5000字AI研究报告** - 完整的学术论文格式
- **多级标题结构** - 自动编号和层级管理
- **参考文献管理** - 标准学术引用格式
### 3. 格式化处理
- **段落分隔修复** - 解决长文档格式问题
- **中文支持优化** - 完美处理中文字符
- **样式自动应用** - 智能格式化和美化
## 🛡️ 技术特性
- **MCP协议兼容** - 标准Model Context Protocol
- **RESTful API** - 支持JSON数据交换
- **流式处理** - 高效的内存使用
- **错误恢复** - 智能错误处理和重试
- **并发安全** - 支持多客户端同时访问
## 📋 技术栈
- **运行时**: Node.js 18.0+
- **框架**: Express.js
- **协议**: @modelcontextprotocol/sdk
- **文档处理**: docx、mammoth
- **实用工具**: uuid、cors、fs
## 🔄 更新日志
### v1.2.0 (2024-05-30)
- ✅ 支持大数据量表格处理(50+行)
- ✅ 优化中文字符和段落处理
- ✅ 修复长文档格式分隔问题
- ✅ 新增AI专用展示界面
- ✅ 清理冗余文件和优化性能
### v1.1.0
- ✅ 格式化文档功能
- ✅ 表格处理能力
- ✅ MCP协议集成
### v1.0.0
- ✅ 基础文档创建和读取
- ✅ 文本替换功能
## 🤝 贡献指南
欢迎提交Issue和Pull Request:
1. Fork本项目
2. 创建功能分支
3. 提交更改
4. 发起Pull Request
## 📜 许可证
MIT License - 可自由使用和修改