YouTube Vision MCP サーバー ( youtube-vision )
Google Gemini Vision API を利用して YouTube 動画と連携する MCP(Model Context Protocol)サーバー。ユーザーは YouTube 動画から説明、要約、質問への回答、重要な場面の抽出などを取得できます。
特徴
Gemini Vision API を使用して YouTube ビデオを分析します。
さまざまなインタラクションに対応する複数のツールを提供します。
一般的な説明またはQ&A(
ask_about_youtube_video)要約(
summarize_youtube_video)キーモーメント抽出 (
extract_key_moments)
generateContentをサポートする利用可能な Gemini モデルを一覧表示します。環境変数を介して構成可能な Gemini モデル。
stdio (標準入出力) を介して通信します。
Related MCP server: Google Search MCP Server
前提条件
このサーバーを使用する前に、次のものを用意してください。
**Node.js:**バージョン18以上を推奨。nodejs.orgからダウンロードできます。
Google Gemini API キー: Google AI Studioまたは Google Cloud Console から API キーを取得します。
インストールと使用方法
このサーバーを使用するには、主に 2 つの方法があります。
Smithery経由でインストール
Smithery経由で Claude Desktop 用の youtube-vision-mcp を自動的にインストールするには:
オプション 1: npx を使用する (簡単な使用に推奨)
このサーバーを実行する最も簡単な方法はnpxを使用することです。これにより、永続的なインストールを必要とせずにパッケージをダウンロードして実行できます。
MCP クライアントの設定ファイル (Claude、VSCode など) 内で構成できます。
"YOUR_GEMINI_API_KEY"実際の Google Gemini API キーに置き換えます。
オプション2: 手動インストール(ソースから)
コードを変更したり、ソースから直接実行したりする場合は、次の手順を実行します。
リポジトリをクローンします。
git clone https://github.com/minbang930/Youtube-Vision-MCP.git cd youtube-vision依存関係をインストールします:
npm installプロジェクトをビルドします。
npm run build**構成と実行:**その後、コンパイルされたコードを
node dist/index.jsを使用して直接実行できます (GEMINI_API_KEY環境変数として設定されていることを確認してください)。または、MCP クライアントを構成して、nodeコマンドとdist/index.jsへの絶対パスを使用してコードを実行し、npx の例に示すようにenv設定を介して API キーを渡します。
構成
サーバーは次の環境変数を使用します。
GEMINI_API_KEY(必須): Google Gemini API キー。GEMINI_MODEL_NAME(オプション):使用するGeminiモデル(例:gemini-1.5-flash)。デフォルトはgemini-2.0-flashです。**重要:**本番環境または商用利用の場合は、「試験運用版」または「プレビュー版」とマークされていないモデルバージョンを選択してください。
環境変数は、MCP クライアントの設定ファイル (例: mcp_settings.json ) のenvセクションで設定する必要があります。
利用可能なツール
1. ask_about_youtube_video
ビデオに関する質問に答えます。質問がない場合は、一般的な説明を提供します。
入力:
youtube_url(文字列、必須): YouTube ビデオの URL。question(文字列, オプション): 動画について尋ねる具体的な質問。省略した場合は、一般的な説明が生成されます。
**出力:**回答または説明を含むテキスト。
2. summarize_youtube_video
指定された YouTube 動画の概要を生成します。
入力:
youtube_url(文字列、必須): YouTube ビデオの URL。summary_length(文字列、オプション): 希望する要約の長さ ('short'、'medium'、'long')。デフォルトは 'medium' です。
**出力:**ビデオの概要を含むテキスト。
3. 重要なextract_key_moments
指定された YouTube 動画から重要な瞬間 (タイムスタンプと説明) を抽出します。
入力:
youtube_url(文字列、必須): YouTube ビデオの URL。number_of_moments(整数、オプション):抽出するキーモーメントの数。デフォルトは3です。
**出力:**タイムスタンプ付きの重要な瞬間を説明するテキスト。
4. list_supported_models
generateContentメソッドをサポートする利用可能な Gemini モデルを一覧表示します (REST API 経由で取得)。
**入力:**なし
**出力:**サポートされているモデル名をリストしたテキスト。
重要な注意事項
**本番環境向けモデルの選択:**このサーバーを本番環境または商用目的で使用する場合は、選択した
GEMINI_MODEL_NAMEが本番環境に適した安定したバージョンであることを確認してください。Gemini API利用規約に従い、「試験運用版」または「プレビュー版」とマークされたモデルは本番環境での展開は許可されていません。**API利用規約:**このサーバーの使用はGoogle Gemini APIに依存しています。ユーザーはGoogle API利用規約およびGemini API追加利用規約を確認し、遵守する責任があります。Gemini APIの無料プランと有料プランでは、データ利用ポリシーが異なる場合がありますのでご注意ください。無料プランをご利用の際は、機密情報や機密情報を送信しないでください。
コンテンツに関する責任: Gemini API を通じて生成されるコンテンツの正確性と適切性は保証されません。生成されたコンテンツを利用または公開する前に、ご自身の判断で判断してください。
ライセンス
このプロジェクトはMITライセンスの下で提供されています。詳細はLICENSEファイルをご覧ください。