jieba-mcp
基于 jieba 中文分词的 MCP (Model Context Protocol) 服务器,使用 FastMCP 框架构建。
项目简介
这是一个 MCP 服务器,提供中文文本分词功能。通过 FastMCP 框架将 jieba 分词能力封装为标准的 MCP 工具,可以被支持 MCP 协议的客户端(如 Claude Desktop)调用。
功能特性
支持三种分词模式:
精确模式(默认):试图将句子最精确地切开,适合文本分析
全模式:把句子中所有的可以成词的词语都扫描出来
搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率
自动过滤空白字符
基于 SSE (Server-Sent Events) 传输协议
Docker 容器化部署支持
安装和使用
1. 直接运行
2. Docker 部署
API 文档
jieba_segment 工具
对中文文本进行分词处理。
参数:
text(str): 待分词的中文文本mode(str, 可选): 分词模式,默认为 "precise""precise": 精确模式"full": 全模式"search": 搜索引擎模式
返回值:
List[str]: 分词后的词语列表(已去除空白字符)
示例:
项目结构
技术栈
Python 3.11+: 主要编程语言
jieba: 中文分词库
FastMCP: MCP 服务器框架
Docker: 容器化部署
配置
服务器默认配置:
主机:
0.0.0.0端口:
9998传输协议: SSE (Server-Sent Events)
如需修改配置,请编辑 main.py 文件中的相关参数。
开发
本地开发环境搭建
克隆项目:
创建虚拟环境:
安装依赖:
启动开发服务器:
MCP 客户端集成
要在支持 MCP 的客户端(如 Claude Desktop)中使用此服务器:
启动 jieba-mcp 服务器
在客户端配置中添加 MCP 服务器连接
指定服务器地址为
http://localhost:9998
贡献
欢迎提交 Issue 和 Pull Request 来改进这个项目。
许可证
本项目采用 MIT 许可证。详情请参阅 LICENSE 文件。
相关链接
jieba - 中文分词库
FastMCP - MCP 服务器框架
Model Context Protocol - MCP 协议规范