Youtube Vision MCP

by minbang930
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Leverages the Gemini Vision API to process and analyze YouTube video content, with support for multiple Gemini models that can be configured via environment variables.

  • Analyzes YouTube videos using the Gemini Vision API to provide descriptions, answers to questions, summaries, and extraction of key moments with timestamps.

YouTube Vision MCP サーバー ( youtube-vision )

Google Gemini Vision API を利用して YouTube 動画と連携する MCP(Model Context Protocol)サーバー。ユーザーは YouTube 動画から説明、要約、質問への回答、重要な場面の抽出などを取得できます。

特徴

  • Gemini Vision API を使用して YouTube ビデオを分析します。
  • さまざまなインタラクションに対応する複数のツールを提供します。
    • 一般的な説明またはQ&A( ask_about_youtube_video
    • 要約( summarize_youtube_video
    • キーモーメント抽出 ( extract_key_moments )
  • generateContentをサポートする利用可能な Gemini モデルを一覧表示します。
  • 環境変数を介して構成可能な Gemini モデル。
  • stdio (標準入出力) を介して通信します。

前提条件

このサーバーを使用する前に、次のものを用意してください。

  • **Node.js:**バージョン18以上を推奨。nodejs.orgからダウンロードできます。
  • Google Gemini API キー: Google AI Studioまたは Google Cloud Console から API キーを取得します。

インストールと使用方法

このサーバーを使用するには、主に 2 つの方法があります。

Smithery経由でインストール

Smithery経由で Claude Desktop 用の youtube-vision-mcp を自動的にインストールするには:

npx -y @smithery/cli install @minbang930/youtube-vision-mcp --client claude

オプション 1: npx を使用する (簡単な使用に推奨)

このサーバーを実行する最も簡単な方法はnpxを使用することです。これにより、永続的なインストールを必要とせずにパッケージをダウンロードして実行できます。

MCP クライアントの設定ファイル (Claude、VSCode など) 内で構成できます。

{ "mcpServers": { "youtube-vision": { "command": "npx", "args": [ "-y", "youtube-vision" ], "env": { "GEMINI_API_KEY": "YOUR_GEMINI_API_KEY", "GEMINI_MODEL_NAME": "gemini-2.0-flash" } } } }

"YOUR_GEMINI_API_KEY"実際の Google Gemini API キーに置き換えます。

オプション2: 手動インストール(ソースから)

コードを変更したり、ソースから直接実行したりする場合は、次の手順を実行します。

  1. リポジトリをクローンします。
    git clone https://github.com/minbang930/Youtube-Vision-MCP.git cd youtube-vision
  2. 依存関係をインストールします:
    npm install
  3. プロジェクトをビルドします。
    npm run build
  4. **構成と実行:**その後、コンパイルされたコードをnode dist/index.jsを使用して直接実行できます ( GEMINI_API_KEY環境変数として設定されていることを確認してください)。または、MCP クライアントを構成して、 nodeコマンドとdist/index.jsへの絶対パスを使用してコードを実行し、npx の例に示すようにenv設定を介して API キーを渡します。

構成

サーバーは次の環境変数を使用します。

  • GEMINI_API_KEY (必須): Google Gemini API キー。
  • GEMINI_MODEL_NAME (オプション):使用するGeminiモデル(例: gemini-1.5-flash )。デフォルトはgemini-2.0-flashです。**重要:**本番環境または商用利用の場合は、「試験運用版」または「プレビュー版」とマークされていないモデルバージョンを選択してください。

環境変数は、MCP クライアントの設定ファイル (例: mcp_settings.json ) のenvセクションで設定する必要があります。

利用可能なツール

1. ask_about_youtube_video

ビデオに関する質問に答えます。質問がない場合は、一般的な説明を提供します。

  • 入力:
    • youtube_url (文字列、必須): YouTube ビデオの URL。
    • question (文字列, オプション): 動画について尋ねる具体的な質問。省略した場合は、一般的な説明が生成されます。
  • **出力:**回答または説明を含むテキスト。

2. summarize_youtube_video

指定された YouTube 動画の概要を生成します。

  • 入力:
    • youtube_url (文字列、必須): YouTube ビデオの URL。
    • summary_length (文字列、オプション): 希望する要約の長さ ('short'、'medium'、'long')。デフォルトは 'medium' です。
  • **出力:**ビデオの概要を含むテキスト。

3. 重要なextract_key_moments

指定された YouTube 動画から重要な瞬間 (タイムスタンプと説明) を抽出します。

  • 入力:
    • youtube_url (文字列、必須): YouTube ビデオの URL。
    • number_of_moments (整数、オプション):抽出するキーモーメントの数。デフォルトは3です。
  • **出力:**タイムスタンプ付きの重要な瞬間を説明するテキスト。

4. list_supported_models

generateContentメソッドをサポートする利用可能な Gemini モデルを一覧表示します (REST API 経由で取得)。

  • **入力:**なし
  • **出力:**サポートされているモデル名をリストしたテキスト。

重要な注意事項

  • **本番環境向けモデルの選択:**このサーバーを本番環境または商用目的で使用する場合は、選択したGEMINI_MODEL_NAMEが本番環境に適した安定したバージョンであることを確認してください。Gemini API利用規約に従い、「試験運用版」または「プレビュー版」とマークされたモデルは本番環境での展開は許可されていません。
  • **API利用規約:**このサーバーの使用はGoogle Gemini APIに依存しています。ユーザーはGoogle API利用規約およびGemini API追加利用規約を確認し、遵守する責任があります。Gemini APIの無料プランと有料プランでは、データ利用ポリシーが異なる場合がありますのでご注意ください。無料プランをご利用の際は、機密情報や機密情報を送信しないでください。
  • コンテンツに関する責任: Gemini API を通じて生成されるコンテンツの正確性と適切性は保証されません。生成されたコンテンツを利用または公開する前に、ご自身の判断で判断してください。

ライセンス

このプロジェクトはMITライセンスの下で提供されています。詳細はLICENSEファイルをご覧ください。

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Google Gemini Vision API を利用して YouTube 動画と連携する MCP(Model Context Protocol)サーバー。ユーザーは YouTube 動画から説明、要約、質問への回答、重要な場面の抽出などを取得できます。

  1. Features
    1. Prerequisites
      1. Installation & Usage
        1. Installing via Smithery
        2. Option 1: Using npx (Recommended for quick use)
        3. Option 2: Manual Installation (from Source)
      2. Configuration
        1. Available Tools
          1. 1. ask_about_youtube_video
          2. 2. summarize_youtube_video
          3. 3. extract_key_moments
          4. 4. list_supported_models
        2. Important Notes
          1. License
            ID: cj4f9yubo7