Integrations
Used for secure configuration management by storing sensitive credentials like the Whissle API token in environment variables
Supported as a model option for the text summarization feature
The implementation language for the server, which handles all API interactions with Whissle
Whissle MCP 服务器
基于 Python 的服务器,提供对 Whissle API 端点的访问,用于语音转文本、二值化、翻译和文本摘要。
⚠️ 重要提示
- 此服务器提供对 Whissle API 端点的访问,这可能会产生费用
- 每个进行 API 调用的工具都会标有成本警告
- 请遵循以下准则:
- 仅在用户明确要求时使用工具
- 对于处理音频的工具,请考虑音频的长度,因为它会影响成本
- 某些操作(例如翻译或摘要)的成本可能会更高
- 描述中没有成本警告的工具可以免费使用,因为它们只读取现有数据
先决条件
- Python 3.8 或更高版本
- pip(Python 包安装程序)
- Whissle API 身份验证令牌
安装
- 克隆存储库:Copy
- 创建并激活虚拟环境:Copy
- 安装所需的软件包:Copy
- 设置环境变量:在项目根目录中创建一个
.env
文件,其内容如下:⚠️重要提示:切勿将你的实际令牌提交到存储库。.env 文件包含在Copy.env
中.gitignore
以防止意外提交。 - 配置 Claude 集成:将
claude_config.example.json
复制到claude_config.json
并更新路径:Copy- 将
/path/to/your/venv/bin/python
替换为虚拟环境中 Python 解释器的实际路径 - 将
/path/to/whissle_mcp/server.py
替换为 server.py 文件的实际路径
- 将
配置
环境变量
WHISSLE_AUTH_TOKEN
:您的 Whissle API 身份验证令牌(必需)- 这是一个敏感凭证,不应共享或提交到版本控制
- 联系您的管理员以获取有效令牌
- 将其安全地存储在本地
.env
文件中
WHISSLE_MCP_BASE_PATH
:文件操作的基本目录(可选,默认为用户的桌面)
支持的音频格式
服务器支持以下音频格式:
- WAV(.wav)
- MP3(.mp3)
- OGG(.ogg)
- FLAC(.flac)
- M4A (.m4a)
文件大小限制
- 最大文件大小:25 MB
- 大于此限制的文件将被拒绝
可用工具
1.语音转文本
使用 Whissle API 将语音转换为文本。
Copy
2. 语音分类
通过说话人识别将语音转换为文本。
Copy
3.文本翻译
将文本从一种语言翻译成另一种语言。
Copy
4.文本摘要
使用 LLM 模型总结文本。
Copy
5. 列出 ASR 模型
列出所有可用的 ASR 模型及其功能。
Copy
响应格式
语音转文本和分词
Copy
翻译
Copy
总结
Copy
错误响应
Copy
错误处理
该服务器包括强大的错误处理功能:
- HTTP 500 错误的自动重试
- 不同故障场景的详细错误消息
- 文件验证(存在性、大小、格式)
- 身份验证检查
常见错误类型:
- HTTP 500:服务器错误(带重试机制)
- HTTP 413:文件太大
- HTTP 415:不支持的文件格式
- HTTP 401/403:身份验证错误
运行服务器
- 启动服务器:Copy
- 服务器将在默认 MCP 端口(通常为 8000)上可用
测试
提供了一个测试脚本来验证所有工具的功能:
Copy
测试脚本将:
- 检查身份验证令牌
- 测试所有可用的工具
- 提供每个操作的详细输出
- 优雅地处理错误
支持
如有问题或疑问,请:
- 检查错误消息以了解具体细节
- 验证您的身份验证令牌
- 确保您的音频文件符合要求
- 针对 API 相关问题联系 Whissle 支持
执照
[在此添加您的许可证信息]
You must be authenticated.
基于 Python 的服务器,提供对 Whissle API 端点的访问,用于语音转文本、二值化、翻译和文本摘要。