YouTube Vision MCP 서버( youtube-vision )
Google Gemini Vision API를 활용하여 YouTube 동영상과 상호작용하는 MCP(Model Context Protocol) 서버입니다. 사용자는 YouTube 동영상에서 설명, 요약, 질문에 대한 답변을 얻고 주요 장면을 추출할 수 있습니다.
특징
Gemini Vision API를 사용하여 YouTube 동영상을 분석합니다.
다양한 상호작용을 위한 여러 도구를 제공합니다.
일반적인 설명 또는 Q&A(
ask_about_youtube_video)요약 (
summarize_youtube_video)주요 순간 추출(
extract_key_moments)
generateContent지원하는 사용 가능한 Gemini 모델을 나열합니다.환경 변수를 통해 구성 가능한 Gemini 모델.
stdio(표준 입출력)를 통해 통신합니다.
Related MCP server: Google Search MCP Server
필수 조건
이 서버를 사용하기 전에 다음 사항이 있는지 확인하세요.
Node.js: 18 버전 이상을 권장합니다. nodejs.org 에서 다운로드할 수 있습니다.
Google Gemini API 키: Google AI Studio 또는 Google Cloud Console에서 API 키를 받으세요.
설치 및 사용
이 서버를 사용하는 두 가지 주요 방법은 다음과 같습니다.
Smithery를 통해 설치
Smithery를 통해 Claude Desktop에 youtube-vision-mcp를 자동으로 설치하려면:
지엑스피1
옵션 1: npx 사용(빠른 사용을 위해 권장)
이 서버를 실행하는 가장 쉬운 방법은 npx 사용하는 것입니다. npx를 사용하면 영구적인 설치가 필요 없이 패키지를 다운로드하여 실행할 수 있습니다.
MCP 클라이언트의 설정 파일(Claude, VSCode 등)에서 구성할 수 있습니다.
"YOUR_GEMINI_API_KEY" 실제 Google Gemini API 키로 바꾸세요.
옵션 2: 수동 설치(소스에서)
코드를 수정하거나 소스에서 직접 실행하려면 다음을 수행하세요.
저장소를 복제합니다.
git clone https://github.com/minbang930/Youtube-Vision-MCP.git cd youtube-vision종속성 설치:
npm install프로젝트를 빌드하세요:
npm run build구성 및 실행: 그런 다음
node dist/index.js사용하여 컴파일된 코드를 직접 실행할 수 있습니다(GEMINI_API_KEY환경 변수로 설정되어 있는지 확인). 또는node명령과dist/index.js의 절대 경로를 사용하여 MCP 클라이언트를 구성하여 이를 실행하고 npx 예제에서 볼 수 있듯이env설정을 통해 API 키를 전달합니다.
구성
서버는 다음과 같은 환경 변수를 사용합니다.
GEMINI_API_KEY(필수): Google Gemini API 키.GEMINI_MODEL_NAME(선택 사항): 사용할 특정 Gemini 모델(예:gemini-1.5-flash)입니다. 기본값은gemini-2.0-flash입니다. 중요: 프로덕션 또는 상업적 용도로 사용하려면 "실험용" 또는 "미리보기"로 표시되지 않은 모델 버전을 선택해야 합니다.
환경 변수는 MCP 클라이언트 설정 파일의 env 섹션(예: mcp_settings.json )에서 설정해야 합니다.
사용 가능한 도구
1. ask_about_youtube_video
영상에 대한 질문에 답하거나, 질문이 없는 경우 일반적인 설명을 제공합니다.
입력:
youtube_url(문자열, 필수): YouTube 동영상의 URL입니다.question(문자열, 선택 사항): 동영상에 대한 구체적인 질문입니다. 생략하면 일반적인 설명이 생성됩니다.
출력: 답변이나 설명이 포함된 텍스트.
2. summarize_youtube_video
주어진 YouTube 비디오의 요약을 생성합니다.
입력:
youtube_url(문자열, 필수): YouTube 동영상의 URL입니다.summary_length(문자열, 선택 사항): 원하는 요약 길이('short', 'medium', 'long'). 기본값은 'medium'입니다.
출력: 비디오 요약을 담은 텍스트.
3. extract_key_moments
YouTube 동영상에서 주요 순간(타임스탬프와 설명)을 추출합니다.
입력:
youtube_url(문자열, 필수): YouTube 동영상의 URL입니다.number_of_moments(정수, 선택 사항): 추출할 주요 순간의 개수입니다. 기본값은 3입니다.
출력: 타임스탬프가 포함된 주요 순간을 설명하는 텍스트입니다.
4. list_supported_models
REST API를 통해 가져온 generateContent 메서드를 지원하는 사용 가능한 Gemini 모델을 나열합니다.
입력: 없음
출력: 지원되는 모델 이름을 나열한 텍스트입니다.
중요 참고 사항
프로덕션용 모델 선택: 이 서버를 프로덕션 또는 상업적 목적으로 사용하는 경우, 선택한
GEMINI_MODEL_NAME이 프로덕션 환경에 적합한 안정적인 버전인지 확인하십시오. Gemini API 서비스 약관 에 따라 "실험용" 또는 "미리보기"로 표시된 모델은 프로덕션 환경에 배포할 수 없습니다.API 서비스 약관: 이 서버는 Google Gemini API를 기반으로 운영됩니다. 사용자는 Google API 서비스 약관 과 Gemini API 추가 서비스 약관 을 검토하고 준수할 책임이 있습니다. Gemini API의 무료 및 유료 버전 간에는 데이터 사용 정책이 다를 수 있습니다. 무료 버전을 사용할 때는 민감하거나 기밀 정보를 제출하지 마십시오.
콘텐츠 책임: Gemini API를 통해 생성된 콘텐츠의 정확성과 적합성은 보장되지 않습니다. 생성된 콘텐츠를 사용하거나 게시하기 전에 신중하게 판단하시기 바랍니다.
특허
이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 라이선스 파일을 참조하세요.