de en es ja ko ru zh

vocotype

Name: vocotype
Author: 233stone

by 233stone

Overview Schema Related Servers Score Discussions

Python

Local

VocoType - 精准的离线语音输入法

VocoType 是一款专为注重隐私和效率的专业人士打造的、完全免费的桌面端语音输入法。所有识别均在本地完成，无惧断网，不上传任何数据。

这个 GitHub 项目是 VocoType 核心引擎的 CLI (命令行) 开源版本，主要面向开发者。

➡️ 想获得最佳体验？请立即下载免费桌面版！

开箱即用，功能更完整，无需任何技术背景。

立即访问官网，下载免费、完整的 VocoType 桌面版

功能简介

VocoType 是一款智能语音输入工具，通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持MCP语音转文字、 AI 优化文本、自定义替换词典等功能，让语音输入更高效、更准确。

📹 演示视频

Related MCP server: LocalVoiceMode

下载

OS	Download
Windows
macOS

🤔 VocoType 为何与众不同？

特性	✅ VocoType	传统云端输入法	操作系统自带
隐私安全	本地离线，绝不上传	❌ 数据需上传云端	⚠️ 隐私政策复杂
网络依赖	完全无需联网	❌ 必须联网使用	❌ 强依赖网络
响应速度	0.1 秒级	慢，受网速影响	慢，受网速影响
定制化能力	强大的自定义词表	弱或无	基本没有

✅ 核心功能

完整的图形用户界面：开箱即用，所有操作清晰直观。
系统级全局输入：在任何软件、任何文本框内都能直接语音输入。
自定义词典：支持添加 20 个常用术语、人名，提升识别准确率。
100% 离线运行：绝对的隐私和数据安全。
旗舰级识别引擎：精准识别中英混合内容。
AI 智能优化：支持选择多种 AI 模型，通过可定制的 Prompt 模板自动修正语音转录中的错别字、同音字和自我修正，智能识别口语中的修正指令（如"不对"、"改成"等），让输出文本更准确流畅。

(对于有更高需求的专业用户，应用内提供了升级到 Pro 版的选项，以解锁无限词典等高级功能。)

🎯 适用各类专业场景

无论是文字工作者、律师、学者、游戏玩家，还是日常办公，VocoType 都能成为您值得信赖的效率伙伴。

用户	场景
作家与创作者	撰写文章、小说，整理会议纪要，让思绪通过语音即时转化为文字，心无旁骛，专注于创作本身。
法律 & 医疗人士	处理高度敏感的客户信息或病历时，100%离线确保数据安全。自定义词表更能轻松驾驭行业术语。
学生与学者	快速记录课堂笔记、整理访谈录音、撰写学术论文。告别繁琐的打字，将更多精力投入到思考与研究之中。
开发者 & 程序员	无论是与 AI 结对编程，还是撰写技术文档，都能精准识别 `function`、`Kubernetes pod` 等专业术语。
游戏玩家	在激烈的游戏对战中，通过语音快速打字与队友交流，无需停下操作，保持游戏节奏，提升团队协作效率。

✨ VocoType 核心引擎特性

所有 VocoType 版本共享同一个强大的核心引擎。

🛡️ 100% 离线，隐私无忧：所有语音识别在您的电脑本地完成。
⚡️ 旗舰级识别引擎：中英混合输入同样精准，告别反复修改。
⚙️ 高度可定制：独创的替换词表功能，让人名、地名、行业术语一次就对。
💻 轻量化设计：仅需 700MB 内存，纯 CPU 推理，无需昂贵显卡。
🚀 0.1 秒级响应：感受所言即所得的畅快，让您的灵感不再因等待而中断。

🛠️ 【开发者专属】CLI 版安装指南

请注意： 此版本面向有一定技术背景的开发者。如果您不熟悉命令行，我们强烈建议您访问官网，下载简单易用的 VocoType 免费桌面版。

1. 环境依赖

Python 3.12
我们强烈建议使用 uv 或 venv 创建虚拟环境。

2. 克隆与安装

# 1. 克隆仓库
git clone https://github.com/233stone/vocotype-cli.git
cd vocotype-cli

# 2. (推荐) 创建并激活虚拟环境
pip install uv
uv venv --python 3.12
source .venv/bin/activate  # macOS/Linux
# 或者 .\.venv\Scripts\activate  (Windows)

# 3. 安装依赖
uv pip install -r requirements.txt

# 4. 运行
python main.py

# 保存数据集运行
python main.py --save-dataset

模型下载：首次运行时，程序会自动下载约 500MB 的模型文件，请确保网络连接稳定。

🌐 Volcengine 火山引擎 BigASR 流式识别后端（可选）

除了默认的本地 FunASR 离线引擎，VocoType CLI 还支持接入火山引擎豆包大模型流式语音识别作为云端识别后端。

优势

特性	本地 FunASR	Volcengine BigASR
网络要求	无	需要联网
模型下载	~500 MB	无需下载
响应延迟	本地推理	云端极低延迟
识别质量	高	旗舰级大模型
数据隐私	完全离线	音频发送至火山引擎

配置步骤

登录火山引擎控制台，创建一个语音应用，获取 App Key 和 Access Key。
在项目目录创建 config.json：

{
  "backend": "volcengine",
  "volcengine": {
    "app_key": "YOUR_APP_KEY",
    "access_key": "YOUR_ACCESS_KEY",
    "resource_id": "volc.bigasr.sauc.duration",
    "enable_punc": true,
    "enable_itn": true
  }
}

以 --config 参数启动：

python main.py --config config.json

注意：使用 Volcengine 后端时，录音数据会发送到火山引擎服务器进行识别，不再完全离线。如对隐私有严格要求，请继续使用默认的本地 FunASR 后端。

常见问题 (FAQ)

Q: 我的数据安全吗？

A: 100%安全。所有语音识别均在本地离线完成，您的音频数据不会上传到任何服务器。

📞 联系我们

Bug 与建议：请优先使用 GitHub Issues。
关注我们获取最新动态：https://vocotype.com

🙏 致谢

VocoType 的诞生离不开以下优秀的开源项目：

FunASR - 阿里巴巴达摩院开源的语音识别框架，为 VocoType 提供了强大的离线语音识别能力。
QuQu - 优秀的开源项目，为 VocoType 提供了重要的技术参考和灵感。

感谢这些开源社区的无私贡献！

This server cannot be installed

license - not found

quality - not tested

maintenance

How are these scores calculated?

Maintenance

–Maintainers

2dResponse time

2wRelease cycle

18Releases (12mo)

Commit activity

Issues opened vs closed

Resources

GitHub Repository

Need Help?

Related Servers

Related MCP Servers

Whispera
Speech Processing Audio Processing
sapoepsilon
A
license
-
quality
A
maintenance
AI-powered voice transcription app for macOS using WhisperKit
Last updated 2026-07-25
158
MIT
LocalVoiceMode
Speech Processing Text-to-Speech Audio Processing
DevMan57
F
license
-
quality
-
maintenance
A local voice interface providing high-performance speech recognition and natural text-to-speech with voice cloning capabilities. It enables AI assistants to speak, listen, and engage in character-based voice conversations through integrated MCP tools.
Last updated 2026-01-25
vibevoice-asr
Speech Processing Audio Processing
tjameswilliams
A
license
A
quality
D
maintenance
Local speech-to-text transcription using Microsoft's VibeVoice-ASR model with speaker diarization, enabling audio transcription directly in AI tools like Claude Code, Cursor, and OpenCode.
Last updated 2026-03-14
3
2
MIT
audio-transcription-mcp
Audio Processing Speech Processing AI & Machine Learning
pmerwin
A
license
-
quality
C
maintenance
Captures and transcribes system audio in real-time using OpenAI Whisper, enabling meeting transcription, content creation, and accessibility through natural language.
Last updated 2025-10-08
193
3
MIT

View all related MCP servers

Related MCP Connectors

BugEzy
Voice-powered bug reporting with 13 MCP tools. Record bugs by talking; let AI find and fix them.
TablaCognita
MCP-native collaborative markdown editor with real-time AI document editing
XMemo
User-owned memory for AI agents, Copilot, Claude, IDEs, CLIs, and chat apps over remote MCP.

View all MCP Connectors

Appeared in Searches

Speech recognition technology and systems

Latest Blog Posts

Who's Calling? MCP Hosts Are an Identity Blind Spot (And the Spec Knows It)
By Om-Shree-0709 on July 25, 2026.
mcp
Agent Identity
OAuth 2.1
Your AI Chatbot Just Exposed Your CEO's Salary to an Intern
By Om-Shree-0709 on July 2, 2026.
Agent Identity
MCP Security
OAuth Delegation
Why MCP Servers Need Execution Sandboxing (And Why Your Current Stack Isn't Enough)
By Om-Shree-0709 on June 30, 2026.
Agentic Ai
Prompt Injection
WebAssembly

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/233stone/vocotype-cli'

If you have feedback or need assistance with the MCP directory API, please join our Discord server