MCP视频识别服务器
MCP(模型上下文协议)服务器,使用 Google 的 Gemini AI 提供图像、音频和视频识别工具。
特征
- 图像识别:使用 Google Gemini AI 分析和描述图像
- 音频识别:使用 Google Gemini AI 分析和转录音频
- 视频识别:使用 Google Gemini AI 分析和描述视频
先决条件
- Node.js 18 或更高版本
- Google Gemini API 密钥
安装
手动安装
- 克隆存储库:Copy
- 安装依赖项:Copy
- 构建项目:Copy
在 FLUJO 中安装
- 单击“添加服务器”
- 将 Github URL 复制并粘贴到 FLUJO 中
- 单击解析、克隆、安装、构建和保存。
通过配置文件安装
要通过配置文件将此 MCP 服务器与 Cline 或其他 MCP 客户端集成:
- 打开您的 Cline 设置:
- 在 VS Code 中,转到“文件”->“首选项”->“设置”
- 搜索“Cline MCP 设置”
- 点击“在settings.json中编辑”
- 将服务器配置添加到
mcpServers
对象:Copy - 将
/path/to/mcp-video-recognition/dist/index.js
替换为项目目录中index.js
文件的实际路径。在 Windows 系统中,请使用正斜杠 (/) 或双反斜杠 (\\) 作为路径。 - 保存设置文件。Cline 应该会自动连接到服务器。
配置
使用环境变量配置服务器:
GOOGLE_API_KEY
(必需):您的 Google Gemini API 密钥TRANSPORT_TYPE
:要使用的传输类型(stdio
或sse
,默认为stdio
)PORT
:SSE 传输的端口号(默认为 3000)LOG_LEVEL
:日志级别(verbose
、debug
、info
、warn
、error
,默认为info
)
用法
启动服务器
使用 stdio 传输(默认)
Copy
使用 SSE Transport
Copy
使用工具
服务器提供了三个可供 MCP 客户端调用的工具:
图像识别
Copy
音频识别
Copy
视频识别
Copy
工具参数
所有工具均接受以下参数:
filepath
(必需):要分析的媒体文件的路径prompt
(可选):识别的自定义提示(默认为“描述此内容”)modelname
(可选):用于识别的 Gemini 模型(默认为“gemini-2.0-flash”)
发展
以开发模式运行
Copy
项目结构
src/index.ts
:入口点src/server.ts
:MCP 服务器实现src/tools/
:工具实现src/services/
:服务实现(Gemini API)src/types/
:类型定义src/utils/
:实用程序函数
执照
麻省理工学院
This server cannot be installed
通过模型上下文协议使用 Google 的 Gemini AI 提供图像、音频和视频识别工具。