VocoType - 精准的离线语音输入法
VocoType 是一款专为注重隐私和效率的专业人士打造的、完全免费的桌面端语音输入法。所有识别均在本地完成,无惧断网,不上传任何数据。
这个 GitHub 项目是 VocoType 核心引擎的 CLI (命令行) 开源版本,主要面向开发者。
➡️ 想获得最佳体验?请立即下载免费桌面版!
开箱即用,功能更完整,无需任何技术背景。
功能简介
VocoType 是一款智能语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持MCP语音转文字、 AI 优化文本、自定义替换词典等功能,让语音输入更高效、更准确。
📹 演示视频
下载
OS | Download |
Windows | |
macOS |
|
🤔 VocoType 为何与众不同?
特性 | ✅ VocoType | 传统云端输入法 | 操作系统自带 |
隐私安全 | 本地离线,绝不上传 | ❌ 数据需上传云端 | ⚠️ 隐私政策复杂 |
网络依赖 | 完全无需联网 | ❌ 必须联网使用 | ❌ 强依赖网络 |
响应速度 | 0.1 秒级 | 慢,受网速影响 | 慢,受网速影响 |
定制化能力 | 强大的自定义词表 | 弱或无 | 基本没有 |
✅ 核心功能
完整的图形用户界面:开箱即用,所有操作清晰直观。
系统级全局输入:在任何软件、任何文本框内都能直接语音输入。
自定义词典:支持添加 20 个常用术语、人名,提升识别准确率。
100% 离线运行:绝对的隐私和数据安全。
旗舰级识别引擎:精准识别中英混合内容。
AI 智能优化:支持选择多种 AI 模型,通过可定制的 Prompt 模板自动修正语音转录中的错别字、同音字和自我修正,智能识别口语中的修正指令(如"不对"、"改成"等),让输出文本更准确流畅。
(对于有更高需求的专业用户,应用内提供了升级到 Pro 版的选项,以解锁无限词典等高级功能。)
🎯 适用各类专业场景
无论是文字工作者、律师、学者、游戏玩家,还是日常办公,VocoType 都能成为您值得信赖的效率伙伴。
用户 | 场景 |
作家与创作者 | 撰写文章、小说,整理会议纪要,让思绪通过语音即时转化为文字,心无旁骛,专注于创作本身。 |
法律 & 医疗人士 | 处理高度敏感的客户信息或病历时,100%离线确保数据安全。自定义词表更能轻松驾驭行业术语。 |
学生与学者 | 快速记录课堂笔记、整理访谈录音、撰写学术论文。告别繁琐的打字,将更多精力投入到思考与研究之中。 |
开发者 & 程序员 | 无论是与 AI 结对编程,还是撰写技术文档,都能精准识别 |
游戏玩家 | 在激烈的游戏对战中,通过语音快速打字与队友交流,无需停下操作,保持游戏节奏,提升团队协作效率。 |
✨ VocoType 核心引擎特性
所有 VocoType 版本共享同一个强大的核心引擎。
🛡️ 100% 离线,隐私无忧:所有语音识别在您的电脑本地完成。
⚡️ 旗舰级识别引擎:中英混合输入同样精准,告别反复修改。
⚙️ 高度可定制:独创的替换词表功能,让人名、地名、行业术语一次就对。
💻 轻量化设计:仅需 700MB 内存,纯 CPU 推理,无需昂贵显卡。
🚀 0.1 秒级响应:感受所言即所得的畅快,让您的灵感不再因等待而中断。
🛠️ 【开发者专属】CLI 版安装指南
请注意: 此版本面向有一定技术背景的开发者。如果您不熟悉命令行,我们强烈建议您访问官网,下载简单易用的 VocoType 免费桌面版。
1. 环境依赖
Python 3.12
我们强烈建议使用
uv或venv创建虚拟环境。
2. 克隆与安装
模型下载:首次运行时,程序会自动下载约 500MB 的模型文件,请确保网络连接稳定。
常见问题 (FAQ)
Q: 我的数据安全吗?
A: 100%安全。所有语音识别均在本地离线完成,您的音频数据不会上传到任何服务器。
📞 联系我们
Bug 与建议:请优先使用 GitHub Issues。
关注我们获取最新动态:https://vocotype.com
🙏 致谢
VocoType 的诞生离不开以下优秀的开源项目:
感谢这些开源社区的无私贡献!