mimo-mcp
Integrates with Xiaomi's MiMo platform to provide multi-modal AI capabilities including chat, image/video understanding, text-to-speech, voice cloning, voice design, and speech recognition.
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@mimo-mcpAnalyze image: https://example.com/pic.jpg"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
mimo-mcp

上图为 60 秒预览(GIF,自动循环);完整 108 秒含音频版: 📥 mimo-mcp-intro.mp4(3.2 MB)
把小米 MiMo 的全模态能力——多模态对话 / 图像 / 视频理解 / TTS / 声音克隆 / 声音设计 / ASR——封装为一个 stdio MCP Server,让 Claude Code 与 Codex 等编程工具直接当 tool 调用,并附带一个本地 Web 管理面板(8 个页面:概览 / 沙盒 / 文字转语音 / 图像视频 / 音色库 / 克隆 / 设计 / 审计)。
亮点
一处实现,Claude Code & Codex 都能用
11 个 MCP tool 覆盖 F1-F8 全模态能力
本地 SQLite 持久化音色库,克隆 / 设计的 voice 一次创建到处用
mimo.tts自动按 voice 类型路由到对应 MiMo 模型(default → tts / clone → voiceclone / design → voicedesign)含 Token Plan 套餐适配 + thinking 模型 max_tokens 兜底等踩坑经验
Web 控制台支持长文按句末标点自动切段批量合成(SSE 流式渲染)
1. 三步上手
1.1 安装依赖
# 后端(Python 3.11+ + uv)
uv sync
# 前端(Node 22+ + pnpm)
cd webui/frontend && pnpm install && cd ../..1.2 配置 API Key
cp .env.example .env
# 用编辑器打开 .env,把 MIMO_API_KEY 改成你在 platform.xiaomimimo.com 拿到的真实 key1.3 启动
用途 | 命令 |
stdio MCP server(给 Claude Code / Codex 用) |
|
本地 Web 控制台后端(:7801) |
|
前端开发模式(:5173,代理到 7801) |
|
前端构建到 dist(后端会托管) |
|
打开 http://localhost:7801(已构建)或 http://localhost:5173(开发模式)即可看到控制台。
2. 项目结构(对应 PRD §6.1)
src/mimo_mcp/ # 共享 SDK 适配层 + FastMCP server
├── api/ # F1-F8 业务编排
├── client.py # httpx async,包装 OpenAI 兼容接口
├── config.py # pydantic-settings,前缀 MIMO_
├── models.py # 请求/响应/voice 数据模型
├── server.py # FastMCP 入口,注册 11 个 tool
└── storage.py # SQLite + 文件存储
webui/
├── backend/ # FastAPI(独立进程,共享 SDK 适配层)
│ └── routers/ # voices / chat / vision / asr / usage
└── frontend/ # Vite + React + TS + Tailwind v4 + shadcn 风格
scripts/ # 启动 / 构建脚本
tests/ # pytest(M0 冒烟覆盖)
data/ # 运行期数据(已 .gitignore)3. 注册到 Claude Code / Codex
3.1 Claude Code(~/.claude/settings.local.json)
把下面这段合并到 mcpServers 字段:
{
"mcpServers": {
"mimo-mcp": {
"command": "/Users/Frank-ay/Desktop/xiaomi-MIMO/scripts/run_mcp.sh"
}
}
}也可以直接用
uv run --directory /Users/Frank-ay/Desktop/xiaomi-MIMO mimo-mcp当 command, 然后在env里传MIMO_API_KEY。脚本方式更省心,因为它自动加载.env。
3.2 Codex(~/.codex/config.toml)
[mcp_servers.mimo-mcp]
command = "/Users/Frank-ay/Desktop/xiaomi-MIMO/scripts/run_mcp.sh"3.3 验证
注册后重启 Claude Code / Codex,问一句 "调用 mimo.health",应该能拿到结构化的健康检查结果。
4. 11 个 MCP Tool
Tool | 说明 |
| 多模态对话(messages 兼容 OpenAI) |
| 图像理解(url / path / base64) |
| 视频理解(URL 模式) |
| 文本合成语音,返回 wav 路径 |
| 上传参考音频创建克隆音色 |
| 文字描述生成自定义音色 |
| 列出本地音色库 |
| 删除本地音色 |
| 语音转写(F7 仅云端,云端缺失时返回 unavailable) |
| 健康检查(配置 / 网络 / 鉴权 / ASR 可用性) |
| 本地 audit_log 聚合的最近用量 |
大文件约定:tool 入参传"本地路径"或"http(s) URL",不要传 base64 大对象(stdio 协议 + 大对象会很慢)。Web UI 上传走 FastAPI 不走 MCP。
5. 路线图
M0 仓库脚手架 ✅(本次提交)
M1 SDK 适配层 — 拿真 API key 实测所有端点,确认 §14 中 3 个未公开细节,填充
client.py与api/*.py的NotImplementedErrorM2 MCP 工具层 — Claude Code / Codex 双注册冒烟通过
M3 Web 后端 — 与 SDK 联通(已具备框架)
M4 Web 前端 — 7 个页面已成型,补完真实联调
M5 联调 + 文档 — 端到端真实流(克隆 → 入库 → MCP 出音)
6. 关键决策(PRD §15)
# | 议题 | 选定 |
Q1 | 实现语言 | Python 3.11 + FastMCP( |
Q2 | Transport | 仅 stdio |
Q3 | Web 前端栈 | Vite + React + TS + Tailwind v4 + shadcn 风格 |
Q4 | MVP 范围 | F1-F8 全量 |
Q5 | skill 联动 | V1 不做,V2 模板形式 |
Q6 | ASR 兜底 | 仅 MiMo 云端,云端缺失则 F7 显式 unavailable |
7. 测试
uv run pytest -qM0 冒烟覆盖:模块可 import / Storage CRUD / health_check 不抛 / 11 个 tool 完整注册。
8. 安全
API Key 仅出现在
.env(已 .gitignore),日志不打印Web UI 默认
127.0.0.1,不暴露公网上传素材保存在本地
data/artifacts/,前端禁止外链
9. Token Plan 套餐使用提示(M1 实测确认)
如果你买的是「Token Plan 套餐」(API Key 以 tp- 开头):
必须用专属 base URL,否则报
Invalid API Key。在 platform.xiaomimimo.com 控制台「我的套餐」页面复制「专属 Base URL → 兼容 OpenAI 接口协议」,典型形式https://token-plan-cn.xiaomimimo.com/v1,填到.env的MIMO_BASE_URL。套餐含:V2.5-Pro / V2.5 / V2.5-TTS / V2.5-TTS-VoiceClone / V2.5-TTS-VoiceDesign / V2-Pro / V2-Omni / V2-TTS。不含:V2-Flash 与 V2.5-ASR(F7 因此显式
unavailable,符合 PRD §15-Q6 决策)。v2.5 是 thinking 模型:返回的
message.reasoning_content是思考链,真正回复在message.content。如果max_tokens太小(< 1024)会只见思考、不见回复。本仓库已把默认MIMO_DEFAULT_MAX_TOKENS=4096,长文任务可临时调到 8192+。使用范围:套餐合规用法是「在编程工具中使用」(Claude Code / Codex / OpenCode 等);本仓库的 mimo-mcp 正属于这类。Web 沙盒在本机做轻量调试也无问题,不要做高频自动化压测。
This server cannot be installed
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/Frank-ay/mimo-mcp'
If you have feedback or need assistance with the MCP directory API, please join our Discord server