The douyin-mcp-server downloads watermark-free videos from Douyin (Chinese TikTok) share links and extracts AI-generated transcripts from the audio content.
Core Features:
Parse Video Information - Extract metadata (title, ID) from share links without requiring an API key
Download Watermark-Free Videos - Obtain high-quality video download URLs without watermarks
AI Speech-to-Text Transcription - Automatically transcribe video audio using SenseVoice/Paraformer models (requires DASHSCOPE_API_KEY)
Handle Large Files - Automatically segments audio files longer than 1 hour or larger than 50MB for processing
Access Methods:
WebUI browser interface for easy interaction
MCP integration with Claude Desktop for direct tool calls
Command-line interface for developers and batch processing
Output Options:
Export transcripts as Markdown files with formatted metadata (video ID, timestamp, download links)
Configure API keys via WebUI or environment variables
Extracts audio from downloaded Douyin videos, enabling the conversion of video content to audio format for text transcription.
Supports repository access for development and contribution purposes, allowing users to clone the source code and submit issues or pull requests.
Click on "Install Server".
Wait a few minutes for the server to deploy. Once ready, it will show a "Started" state.
In the chat, type
@followed by the MCP server name and your instructions, e.g., "@douyin-mcp-serverextract text from this Douyin video: https://v.douyin.com/example123"
That's it! The server will respond to your query, and you can continue using it as needed.
Here is a step-by-step guide with screenshots.
短视频文案提取器
从短视频分享链接下载无水印视频,AI 自动提取语音文案。

✨ 功能特性
🎬 无水印视频 - 获取高质量无水印视频下载链接
🎙️ AI 语音识别 - 使用硅基流动 SenseVoice 自动提取文案
📑 大文件支持 - 自动分段处理超过 1 小时或 50MB 的音频
🌐 WebUI - 现代化浏览器界面,无需命令行
🔌 MCP 集成 - 支持 Claude Desktop 等 AI 应用
Related MCP server: mcp-server-docy
📦 使用方式
方式 | 适用场景 | 特点 |
普通用户 | 浏览器操作,最简单 | |
Claude Desktop 用户 | AI 对话中直接调用 | |
开发者 | 批量处理,脚本集成 |
🌐 WebUI (推荐)
最简单的使用方式,打开浏览器即可使用。
快速开始
打开浏览器访问 http://localhost:8080
配置 API Key
有两种方式配置 API Key:
方式一:浏览器内配置(推荐)
打开 WebUI 页面
点击顶部的「API 未配置」按钮
在弹窗中输入 API Key 并保存
API Key 保存在浏览器本地,刷新页面后仍有效
方式二:环境变量
💡 获取免费 API Key:硅基流动(新用户有免费额度)
功能说明
操作 | 说明 | 需要 API |
获取信息 | 解析视频标题、ID,获取无水印下载链接 | ❌ |
提取文案 | 下载视频 → 提取音频 → AI 语音识别 | ✅ |
下载视频 | 点击下载链接保存无水印视频 | ❌ |
复制/下载文案 | 一键复制或下载 Markdown 格式文案 | - |
使用步骤
粘贴链接 - 将分享链接粘贴到输入框
点击按钮 - 选择「获取信息」或「提取文案」
查看结果 - 右侧显示视频信息和提取的文案
导出 - 复制文案或下载 Markdown 文件
🚀 MCP Server
在 Claude Desktop、Cherry Studio 等支持 MCP 的应用中使用。
配置方法
编辑 MCP 配置文件,添加:
可用工具
工具名 | 功能 | 需要 API |
| 解析视频信息 | ❌ |
| 获取下载链接 | ❌ |
| 提取视频文案 | ✅ |
对话示例
🛠️ 命令行工具
适合开发者和批量处理场景。
安装
命令说明
输出格式
transcript.md 内容:
📋 系统要求
依赖 | 说明 | 安装方式 |
uv | Python 包管理 |
|
Python | 3.10+ |
|
FFmpeg | 音视频处理 |
|
🔧 技术说明
大文件处理
当音频文件超过 API 限制时(1 小时或 50MB),自动执行:
检测音频时长和文件大小
使用 FFmpeg 分割成 9 分钟的片段
逐段调用 API 转录
合并所有文本结果
API 说明
语音识别使用 硅基流动 SenseVoice API:
模型:
FunAudioLLM/SenseVoiceSmall限制:单次最大 1 小时 / 50MB(已自动处理)
费用:新用户有免费额度
📝 更新日志
v1.4.0 (最新)
🌐 WebUI - 新增浏览器可视化界面
🔑 浏览器配置 API Key - 无需环境变量
📑 大文件支持 - 自动分段处理长音频
v1.3.0
✨ Claude Code Skill 支持
📄 Markdown 格式输出
v1.2.0
🔄 API 升级
v1.0.0
🎉 首次发布
⚠️ 免责声明
本项目仅供学习和研究使用
使用者需遵守相关法律法规
禁止用于侵犯知识产权的行为
作者不对使用本项目产生的损失承担责任
📄 许可证
Apache License 2.0