-
securityA
license-
qualityA server that provides AI-powered image generation, modification, and processing capabilities through the Model Context Protocol, leveraging Google Gemini models and other image services.
Last updated -
13
MIT License
Google の Gemini AI を使用して画像、音声、ビデオ認識用のツールを提供する MCP (Model Context Protocol) サーバー。
構成ファイルを介してこの MCP サーバーを Cline または他の MCP クライアントと統合するには、次の手順を実行します。
mcpServers
オブジェクトにサーバー構成を追加します。/path/to/mcp-video-recognition/dist/index.js
を、プロジェクトディレクトリ内のindex.js
ファイルへの実際のパスに置き換えてください。Windows の場合は、パスにスラッシュ (/) または二重のバックスラッシュ (\\) を使用してください。サーバーは環境変数を使用して構成されます。
GOOGLE_API_KEY
(必須): Google Gemini API キーTRANSPORT_TYPE
: 使用するトランスポートタイプ ( stdio
またはsse
、デフォルトはstdio
)PORT
: SSEトランスポートのポート番号(デフォルトは3000)LOG_LEVEL
: ログレベル ( verbose
、 debug
、 info
、 warn
、 error
、デフォルトはinfo
)サーバーは、MCP クライアントから呼び出すことができる 3 つのツールを提供します。
すべてのツールは次のパラメータを受け入れます。
filepath
(必須): 分析するメディアファイルへのパスprompt
(オプション):認識のためのカスタムプロンプト(デフォルトは「このコンテンツを説明してください」)modelname
(オプション): 認識に使用する Gemini モデル (デフォルトは "gemini-2.0-flash")src/index.ts
: エントリポイントsrc/server.ts
: MCP サーバーの実装src/tools/
: ツールの実装src/services/
: サービス実装 (Gemini API)src/types/
: 型定義src/utils/
: ユーティリティ関数マサチューセッツ工科大学
remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
モデル コンテキスト プロトコルを通じて Google の Gemini AI を使用して、画像、音声、ビデオを認識するためのツールを提供します。
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/mario-andreschak/mcp_video_recognition'
If you have feedback or need assistance with the MCP directory API, please join our Discord server