Youtube Vision MCP

by minbang930
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Leverages the Gemini Vision API to process and analyze YouTube video content, with support for multiple Gemini models that can be configured via environment variables.

  • Analyzes YouTube videos using the Gemini Vision API to provide descriptions, answers to questions, summaries, and extraction of key moments with timestamps.

YouTube Vision MCP 서버( youtube-vision )

Google Gemini Vision API를 활용하여 YouTube 동영상과 상호작용하는 MCP(Model Context Protocol) 서버입니다. 사용자는 YouTube 동영상에서 설명, 요약, 질문에 대한 답변을 얻고 주요 장면을 추출할 수 있습니다.

특징

  • Gemini Vision API를 사용하여 YouTube 동영상을 분석합니다.
  • 다양한 상호작용을 위한 여러 도구를 제공합니다.
    • 일반적인 설명 또는 Q&A( ask_about_youtube_video )
    • 요약 ( summarize_youtube_video )
    • 주요 순간 추출( extract_key_moments )
  • generateContent 지원하는 사용 가능한 Gemini 모델을 나열합니다.
  • 환경 변수를 통해 구성 가능한 Gemini 모델.
  • stdio(표준 입출력)를 통해 통신합니다.

필수 조건

이 서버를 사용하기 전에 다음 사항이 있는지 확인하세요.

  • Node.js: 18 버전 이상을 권장합니다. nodejs.org 에서 다운로드할 수 있습니다.
  • Google Gemini API 키: Google AI Studio 또는 Google Cloud Console에서 API 키를 받으세요.

설치 및 사용

이 서버를 사용하는 두 가지 주요 방법은 다음과 같습니다.

Smithery를 통해 설치

Smithery를 통해 Claude Desktop에 youtube-vision-mcp를 자동으로 설치하려면:

지엑스피1

옵션 1: npx 사용(빠른 사용을 위해 권장)

이 서버를 실행하는 가장 쉬운 방법은 npx 사용하는 것입니다. npx를 사용하면 영구적인 설치가 필요 없이 패키지를 다운로드하여 실행할 수 있습니다.

MCP 클라이언트의 설정 파일(Claude, VSCode 등)에서 구성할 수 있습니다.

{ "mcpServers": { "youtube-vision": { "command": "npx", "args": [ "-y", "youtube-vision" ], "env": { "GEMINI_API_KEY": "YOUR_GEMINI_API_KEY", "GEMINI_MODEL_NAME": "gemini-2.0-flash" } } } }

"YOUR_GEMINI_API_KEY" 실제 Google Gemini API 키로 바꾸세요.

옵션 2: 수동 설치(소스에서)

코드를 수정하거나 소스에서 직접 실행하려면 다음을 수행하세요.

  1. 저장소를 복제합니다.
    git clone https://github.com/minbang930/Youtube-Vision-MCP.git cd youtube-vision
  2. 종속성 설치:
    npm install
  3. 프로젝트를 빌드하세요:
    npm run build
  4. 구성 및 실행: 그런 다음 node dist/index.js 사용하여 컴파일된 코드를 직접 실행할 수 있습니다( GEMINI_API_KEY 환경 변수로 설정되어 있는지 확인). 또는 node 명령과 dist/index.js 의 절대 경로를 사용하여 MCP 클라이언트를 구성하여 이를 실행하고 npx 예제에서 볼 수 있듯이 env 설정을 통해 API 키를 전달합니다.

구성

서버는 다음과 같은 환경 변수를 사용합니다.

  • GEMINI_API_KEY (필수): Google Gemini API 키.
  • GEMINI_MODEL_NAME (선택 사항): 사용할 특정 Gemini 모델(예: gemini-1.5-flash )입니다. 기본값은 gemini-2.0-flash 입니다. 중요: 프로덕션 또는 상업적 용도로 사용하려면 "실험용" 또는 "미리보기"로 표시되지 않은 모델 버전을 선택해야 합니다.

환경 변수는 MCP 클라이언트 설정 파일의 env 섹션(예: mcp_settings.json )에서 설정해야 합니다.

사용 가능한 도구

1. ask_about_youtube_video

영상에 대한 질문에 답하거나, 질문이 없는 경우 일반적인 설명을 제공합니다.

  • 입력:
    • youtube_url (문자열, 필수): YouTube 동영상의 URL입니다.
    • question (문자열, 선택 사항): 동영상에 대한 구체적인 질문입니다. 생략하면 일반적인 설명이 생성됩니다.
  • 출력: 답변이나 설명이 포함된 텍스트.

2. summarize_youtube_video

주어진 YouTube 비디오의 요약을 생성합니다.

  • 입력:
    • youtube_url (문자열, 필수): YouTube 동영상의 URL입니다.
    • summary_length (문자열, 선택 사항): 원하는 요약 길이('short', 'medium', 'long'). 기본값은 'medium'입니다.
  • 출력: 비디오 요약을 담은 텍스트.

3. extract_key_moments

YouTube 동영상에서 주요 순간(타임스탬프와 설명)을 추출합니다.

  • 입력:
    • youtube_url (문자열, 필수): YouTube 동영상의 URL입니다.
    • number_of_moments (정수, 선택 사항): 추출할 주요 순간의 개수입니다. 기본값은 3입니다.
  • 출력: 타임스탬프가 포함된 주요 순간을 설명하는 텍스트입니다.

4. list_supported_models

REST API를 통해 가져온 generateContent 메서드를 지원하는 사용 가능한 Gemini 모델을 나열합니다.

  • 입력: 없음
  • 출력: 지원되는 모델 이름을 나열한 텍스트입니다.

중요 참고 사항

  • 프로덕션용 모델 선택: 이 서버를 프로덕션 또는 상업적 목적으로 사용하는 경우, 선택한 GEMINI_MODEL_NAME 이 프로덕션 환경에 적합한 안정적인 버전인지 확인하십시오. Gemini API 서비스 약관 에 따라 "실험용" 또는 "미리보기"로 표시된 모델은 프로덕션 환경에 배포할 수 없습니다.
  • API 서비스 약관: 이 서버는 Google Gemini API를 기반으로 운영됩니다. 사용자는 Google API 서비스 약관Gemini API 추가 서비스 약관 을 검토하고 준수할 책임이 있습니다. Gemini API의 무료 및 유료 버전 간에는 데이터 사용 정책이 다를 수 있습니다. 무료 버전을 사용할 때는 민감하거나 기밀 정보를 제출하지 마십시오.
  • 콘텐츠 책임: Gemini API를 통해 생성된 콘텐츠의 정확성과 적합성은 보장되지 않습니다. 생성된 콘텐츠를 사용하거나 게시하기 전에 신중하게 판단하시기 바랍니다.

특허

이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 라이선스 파일을 참조하세요.

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Google Gemini Vision API를 활용하여 YouTube 동영상과 상호작용하는 MCP(Model Context Protocol) 서버입니다. 사용자는 YouTube 동영상에서 설명, 요약, 질문에 대한 답변을 얻고 주요 장면을 추출할 수 있습니다.

  1. Features
    1. Prerequisites
      1. Installation & Usage
        1. Installing via Smithery
        2. Option 1: Using npx (Recommended for quick use)
        3. Option 2: Manual Installation (from Source)
      2. Configuration
        1. Available Tools
          1. 1. ask_about_youtube_video
          2. 2. summarize_youtube_video
          3. 3. extract_key_moments
          4. 4. list_supported_models
        2. Important Notes
          1. License
            ID: cj4f9yubo7