Supports containerized deployment with provided Dockerfile configurations for both base environment and the MCP service.
Used for video processing and extraction of audio from videos to support the text content extraction feature that converts speech to text.
Hosts the project repository for source code access, issue reporting, and contribution through pull requests.
Enables parsing of Kuaishou video share links to extract no-watermark video URLs, cover images, titles, and author information.
Utilizes Pydantic for data validation and structure in the video parsing processes.
Distributes the MCP server as a Python package, allowing easy installation via pip from the Python Package Index.
全网短视频去水印链接提取 MCP服务
项目简介
本项目是一个基于 FastMCP 的全网短视频去水印解析服务,支持多平台视频分享链接的解析,自动提取视频真实地址及相关信息。
适用于需要批量解析、去水印、采集短视频的场景。本项目还支持视频内容文本提取功能,可以通过语音识别将视频内容转为文本。
主要特性
- 支持20+种短视频平台(抖音、快手、小红书、微博、西瓜视频等)
- 一键解析视频分享链接,获取无水印视频地址
- 支持多种传输方式(stdio、SSE、HTTP)
- 支持视频内容文本提取功能(需要FFmpeg和API Key、默认使用硅基流动:https://cloud.siliconflow.cn/i/tbvUltCF )
- 支持Docker容器化部署
- 代码结构清晰,易于扩展
演示
支持平台
目前支持以下短视频平台的解析:
- 抖音(DouYin)
- 快手(KuaiShou)
- 小红书(RedBook)
- 微博(WeiBo)
- 皮皮虾(PiPiXia)
- 微视(WeiShi)
- 绿洲(LvZhou)
- 最右(ZuiYou)
- 度小视/全民小视频(QuanMin)
- 西瓜视频(XiGua)
- 梨视频(LiShiPin)
- 皮皮搞笑(PiPiGaoXiao)
- 虎牙(HuYa)
- AcFun(AcFun)
- 逗拍(DouPai)
- 美拍(MeiPai)
- 全民K歌(QuanMinKGe)
- 六间房(SixRoom)
- 新片场(XinPianChang)
- 好看视频(HaoKan)
目录结构
安装方法
前置依赖
FFmpeg 安装(视频文本内容提取必需)
Ubuntu/Debian:
CentOS/RHEL:
macOS:
Windows:
- 下载 FFmpeg: https://ffmpeg.org/download.html#build-windows
- 解压到指定目录,如
C:\ffmpeg
- 添加到系统环境变量 PATH:
C:\ffmpeg\bin
- 重启命令行或系统以使环境变量生效
验证安装:
方法一:pypi 使用 pip 安装 (推荐)
当前最新版本:
安装完成后,可以通过以下命令验证安装:
MCP 配置使用
方法二:从源码安装
- 克隆本项目
- 安装依赖推荐使用 Python 3.10+,并建议使用虚拟环境:macOS/Linux:Windows:
方法三:使用 Docker 部署
本项目提供了 Docker 支持, 快速部署运行
- 运行容器 拉取镜像 sse 模式
可以通过以下命令快速构建部署:
- 构建基础镜像(包含 FFmpeg 和 Python 环境)
- 构建 MCP 服务镜像
- 运行容器
使用方法
stdio MCP启动服务
SSE or HTTP MCP服务地址
- 支持请求头配置apikey
- 支持请求参数配置apikey
启动服务
参数说明:
--transport
传输方式,可选:stdio
、sse
、http
(推荐 http)--host
主机地址,默认0.0.0.0
--port
端口号,默认8000
--path
自定义MCP请求路径(可选)
API 接口说明
1. 解析视频分享链接
接口名称: share_url_parse_tool
请求参数:
参数名 | 类型 | 必填 | 说明 |
---|---|---|---|
url | string | 是 | 视频分享链接 |
返回示例:
2. 根据视频ID解析
接口名称: video_id_parse_tool
请求参数:
参数名 | 类型 | 必填 | 说明 |
---|---|---|---|
source | string | 是 | 视频来源,如 douyin、kuaishou 等 |
video_id | string | 是 | 视频ID |
返回示例: 同上
3. 视频内容文本提取
接口名称: share_text_parse_tool
请求参数:
参数名 | 类型 | 必填 | 说明 |
---|---|---|---|
share_link | string | 是 | 抖音分享链接或包含链接的文本 |
api_base_url | string | 否 | API基础URL,默认使用SiliconFlow |
model | string | 否 | 语音识别模型,默认使用SenseVoiceSmall |
链接 sse、Streamable HTTP模式的时候只需要将 apikey 带入请求参数当中: http://127.0.0.1:8637/sse?apikey=xxxxxx 使用的大模型是硅基流动前往获取apikey即可:https://cloud.siliconflow.cn/i/tbvUltCF
返回示例:
依赖说明
主要依赖包括:
- fastmcp: MCP服务框架
- httpx: 异步HTTP客户端
- ffmpeg-python: 视频处理
- lxml & parsel: HTML解析
- fake-useragent: 模拟浏览器请求
- pydantic: 数据验证
Docker 部署
项目提供了两个Dockerfile:
Dockerfile.base
: 构建基础镜像,包含Python环境和FFmpegDockerfile.mcp
: 构建MCP服务镜像
使用脚本快速部署:
运行容器 拉取镜像 sse 模式
贡献与反馈
欢迎提交 issue 或 PR 参与项目改进!
- 项目地址: https://github.com/yangbuyiya/yby6-crawling-short-video-mcp
- 作者邮箱: yangbuyiya@duck.com
本项目站在巨人的肩膀上二次开发,感谢以下项目:
⚠️ 免责声明
- 本项目为开源工具,仅供学习与研究用途。用户在使用本项目过程中产生的任何风险、损失或法律责任,均由用户本人承担,作者及贡献者不承担任何直接或间接责任。
- 本项目的功能和代码基于现有技术实现,作者不承诺其完全正确、无缺陷或持续可用。因项目缺陷或不可用导致的任何后果,作者概不负责。
- 本项目依赖的第三方库、插件或服务,均遵循其原有协议。用户需自行查阅、遵守相关协议,因违反第三方协议产生的责任由用户自负。
- 用户应确保自身的使用行为合法、合规,不得利用本项目从事任何违法、违规或侵犯他人权益的活动。因违法违规使用本项目产生的后果,均由用户自行承担。
- 严禁将本项目用于侵犯知识产权、传播违法信息、商业破解、数据爬取等非法用途。作者坚决反对并不支持任何非法用途。
- 用户在处理数据时,应确保符合相关法律法规(如数据合规、隐私保护等),因违规操作产生的责任由用户承担。
- 作者、贡献者与用户的具体使用行为无关,不承担任何连带责任。基于本项目的二次开发、修改、分发等行为,均与作者无关,相关责任由行为人自负。
- 本项目不授予任何专利许可。因专利纠纷或侵权产生的风险由用户承担。未经作者书面授权,禁止将本项目用于商业宣传、再授权或其他商业用途。
- 作者有权随时终止对违规用户的服务,并要求其删除相关代码和数据。
- 作者有权随时更新本免责声明,用户继续使用即视为接受最新条款。如不同意本声明,请立即停止使用本项目。
This server cannot be installed
A FastMCP-based service that extracts no-watermark links from 20+ video platforms (including TikTok, Kuaishou, etc.) and can convert video speech to text.
Related MCP Servers
- AsecurityAlicenseAqualityA MCP Server for TikTok videos that allows you to get video subtitles and post details, such as the number of likes, hashtags, and publishing time.Last updated -3278JavaScriptMIT License
- -securityFlicense-qualitySimple MCP server that returns the transcription of a Youtube video using url and desired language.Last updated -Python
- -securityFlicense-qualityAn MCP server that downloads videos/extracts audio from various platforms like YouTube, Bilibili, and TikTok, then transcribes them to text using OpenAI's Whisper model.Last updated -5Python
- -securityFlicense-qualityA powerful speech-to-text MCP server that supports multiple audio formats and recognition engines including remote APIs (Bailian, OpenAI Whisper, iFLYTEK), Google Speech Recognition, and CMU Sphinx.Last updated -Python