-
securityA
license-
qualityA Goose MCP extension providing voice interaction with modern audio visualization, allowing users to communicate with Goose through speech rather than text.
Last updated -
36
Python
MIT License
该服务通过 stdio 和 MCP 模式提供语音识别和文本提取功能。
voice_service.py
- 核心服务实现stdio_server.py
- stdio 模式入口点mcp_server.py
- MCP 模式入口点build.py
可执行文件的构建脚本build_exec.sh
- 构建执行脚本test_*.sh
不同功能的测试脚本.env
中设置环境变量:该服务提供结构化的语音识别结果。以下是响应格式的示例:
label_result
字段包含以下结构化信息:
场地 | 描述 | 示例值 |
---|---|---|
局域网 | 语言代码 | “en” |
情绪摇滚 | 情绪状态 | “未知” |
类型 | 音频类型 | “演讲” |
扬声器 | 说话人识别器 | “沃因” |
文本 | 识别的文本内容 | “测试测试测试” |
该服务识别并处理原始响应中的以下特殊标签:
<|en|>
- 语言代码<|EMO_UNKNOWN|>
- 情绪状态<|Speech|>
- 音频类型<|woitn|>
- 说话人标识符可执行文件将在以下位置创建:
dist/voice_stdio
dist/voice_mcp
运行测试脚本:
该项目根据 MIT 许可证获得许可 - 有关详细信息,请参阅 LICENSE 文件。
This server cannot be installed
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
提供语音识别和文本提取功能,支持 stdio 和 MCP 模式,处理音频文件或 base64 编码数据并返回包含语言、情感和说话者信息的结构化结果。
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/yangsenessa/mcp_voice_identify'
If you have feedback or need assistance with the MCP directory API, please join our Discord server