Skip to main content
Glama

VocoType - 精准的离线语音输入法

VocoType 是一款专为注重隐私和效率的专业人士打造的、完全免费的桌面端语音输入法。所有识别均在本地完成,无惧断网,不上传任何数据。

这个 GitHub 项目是 VocoType 核心引擎的 CLI (命令行) 开源版本,主要面向开发者。


➡️ 想获得最佳体验?请立即下载免费桌面版!

开箱即用,功能更完整,无需任何技术背景。

立即访问官网,下载免费、完整的 VocoType 桌面版

功能简介

VocoType 是一款智能语音输入工具,通过快捷键即可将语音实时转换为文字并自动输入到当前应用。支持MCP语音转文字、 AI 优化文本、自定义替换词典等功能,让语音输入更高效、更准确。

📹 演示视频

下载

OS

Download

Windows

Setup

macOS

DMG DMG


🤔 VocoType 为何与众不同?

特性

VocoType

传统云端输入法

操作系统自带

隐私安全

本地离线,绝不上传

❌ 数据需上传云端

⚠️ 隐私政策复杂

网络依赖

完全无需联网

❌ 必须联网使用

❌ 强依赖网络

响应速度

0.1 秒级

慢,受网速影响

慢,受网速影响

定制化能力

强大的自定义词表

弱或无

基本没有

✅ 核心功能

  • 完整的图形用户界面:开箱即用,所有操作清晰直观。

  • 系统级全局输入:在任何软件、任何文本框内都能直接语音输入。

  • 自定义词典:支持添加 20 个常用术语、人名,提升识别准确率。

  • 100% 离线运行:绝对的隐私和数据安全。

  • 旗舰级识别引擎:精准识别中英混合内容。

  • AI 智能优化:支持选择多种 AI 模型,通过可定制的 Prompt 模板自动修正语音转录中的错别字、同音字和自我修正,智能识别口语中的修正指令(如"不对"、"改成"等),让输出文本更准确流畅。

(对于有更高需求的专业用户,应用内提供了升级到 Pro 版的选项,以解锁无限词典等高级功能。)

🎯 适用各类专业场景

无论是文字工作者、律师、学者、游戏玩家,还是日常办公,VocoType 都能成为您值得信赖的效率伙伴。

用户

场景

作家与创作者

撰写文章、小说,整理会议纪要,让思绪通过语音即时转化为文字,心无旁骛,专注于创作本身。

法律 & 医疗人士

处理高度敏感的客户信息或病历时,100%离线确保数据安全。自定义词表更能轻松驾驭行业术语。

学生与学者

快速记录课堂笔记、整理访谈录音、撰写学术论文。告别繁琐的打字,将更多精力投入到思考与研究之中。

开发者 & 程序员

无论是与 AI 结对编程,还是撰写技术文档,都能精准识别 functionKubernetes pod 等专业术语。

游戏玩家

在激烈的游戏对战中,通过语音快速打字与队友交流,无需停下操作,保持游戏节奏,提升团队协作效率。

✨ VocoType 核心引擎特性

所有 VocoType 版本共享同一个强大的核心引擎。

  • 🛡️ 100% 离线,隐私无忧:所有语音识别在您的电脑本地完成。

  • ⚡️ 旗舰级识别引擎:中英混合输入同样精准,告别反复修改。

  • ⚙️ 高度可定制:独创的替换词表功能,让人名、地名、行业术语一次就对。

  • 💻 轻量化设计:仅需 700MB 内存,纯 CPU 推理,无需昂贵显卡。

  • 🚀 0.1 秒级响应:感受所言即所得的畅快,让您的灵感不再因等待而中断。


🛠️ 【开发者专属】CLI 版安装指南

请注意: 此版本面向有一定技术背景的开发者。如果您不熟悉命令行,我们强烈建议您访问官网,下载简单易用的 VocoType 免费桌面版

1. 环境依赖

  • Python 3.12

  • 我们强烈建议使用 uvvenv 创建虚拟环境。

2. 克隆与安装

# 1. 克隆仓库
git clone https://github.com/233stone/vocotype-cli.git
cd vocotype-cli

# 2. (推荐) 创建并激活虚拟环境
pip install uv
uv venv --python 3.12
source .venv/bin/activate  # macOS/Linux
# 或者 .\.venv\Scripts\activate  (Windows)

# 3. 安装依赖
uv pip install -r requirements.txt

# 4. 运行
python main.py

# 保存数据集运行
python main.py --save-dataset

模型下载:首次运行时,程序会自动下载约 500MB 的模型文件,请确保网络连接稳定。

🌐 Volcengine 火山引擎 BigASR 流式识别后端(可选)

除了默认的本地 FunASR 离线引擎,VocoType CLI 还支持接入火山引擎豆包大模型流式语音识别作为云端识别后端。

优势

特性

本地 FunASR

Volcengine BigASR

网络要求

需要联网

模型下载

~500 MB

无需下载

响应延迟

本地推理

云端极低延迟

识别质量

旗舰级大模型

数据隐私

完全离线

音频发送至火山引擎

配置步骤

  1. 登录火山引擎控制台,创建一个语音应用,获取 App KeyAccess Key

  2. 在项目目录创建 config.json

{
  "backend": "volcengine",
  "volcengine": {
    "app_key": "YOUR_APP_KEY",
    "access_key": "YOUR_ACCESS_KEY",
    "resource_id": "volc.bigasr.sauc.duration",
    "enable_punc": true,
    "enable_itn": true
  }
}
  1. --config 参数启动:

python main.py --config config.json

注意:使用 Volcengine 后端时,录音数据会发送到火山引擎服务器进行识别,不再完全离线。如对隐私有严格要求,请继续使用默认的本地 FunASR 后端。

常见问题 (FAQ)

Q: 我的数据安全吗?

A: 100%安全。所有语音识别均在本地离线完成,您的音频数据不会上传到任何服务器。

📞 联系我们

  • Bug 与建议:请优先使用 GitHub Issues。

  • 关注我们获取最新动态https://vocotype.com

🙏 致谢

VocoType 的诞生离不开以下优秀的开源项目:

  • FunASR - 阿里巴巴达摩院开源的语音识别框架,为 VocoType 提供了强大的离线语音识别能力。

  • QuQu - 优秀的开源项目,为 VocoType 提供了重要的技术参考和灵感。

感谢这些开源社区的无私贡献!

F
license - not found
-
quality - not tested
A
maintenance

Maintenance

Maintainers
1dResponse time
1wRelease cycle
16Releases (12mo)
Issues opened vs closed

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/233stone/vocotype-cli'

If you have feedback or need assistance with the MCP directory API, please join our Discord server