remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Integrations
Leverages the Gemini Vision API to process and analyze YouTube video content, with support for multiple Gemini models that can be configured via environment variables.
Analyzes YouTube videos using the Gemini Vision API to provide descriptions, answers to questions, summaries, and extraction of key moments with timestamps.
YouTube Vision MCP 서버( youtube-vision
)
Google Gemini Vision API를 활용하여 YouTube 동영상과 상호작용하는 MCP(Model Context Protocol) 서버입니다. 사용자는 YouTube 동영상에서 설명, 요약, 질문에 대한 답변을 얻고 주요 장면을 추출할 수 있습니다.
특징
- Gemini Vision API를 사용하여 YouTube 동영상을 분석합니다.
- 다양한 상호작용을 위한 여러 도구를 제공합니다.
- 일반적인 설명 또는 Q&A(
ask_about_youtube_video
) - 요약 (
summarize_youtube_video
) - 주요 순간 추출(
extract_key_moments
)
- 일반적인 설명 또는 Q&A(
generateContent
지원하는 사용 가능한 Gemini 모델을 나열합니다.- 환경 변수를 통해 구성 가능한 Gemini 모델.
- stdio(표준 입출력)를 통해 통신합니다.
필수 조건
이 서버를 사용하기 전에 다음 사항이 있는지 확인하세요.
- Node.js: 18 버전 이상을 권장합니다. nodejs.org 에서 다운로드할 수 있습니다.
- Google Gemini API 키: Google AI Studio 또는 Google Cloud Console에서 API 키를 받으세요.
설치 및 사용
이 서버를 사용하는 두 가지 주요 방법은 다음과 같습니다.
Smithery를 통해 설치
Smithery를 통해 Claude Desktop에 youtube-vision-mcp를 자동으로 설치하려면:
지엑스피1
옵션 1: npx 사용(빠른 사용을 위해 권장)
이 서버를 실행하는 가장 쉬운 방법은 npx
사용하는 것입니다. npx를 사용하면 영구적인 설치가 필요 없이 패키지를 다운로드하여 실행할 수 있습니다.
MCP 클라이언트의 설정 파일(Claude, VSCode 등)에서 구성할 수 있습니다.
"YOUR_GEMINI_API_KEY"
실제 Google Gemini API 키로 바꾸세요.
옵션 2: 수동 설치(소스에서)
코드를 수정하거나 소스에서 직접 실행하려면 다음을 수행하세요.
- 저장소를 복제합니다.Copy
- 종속성 설치:Copy
- 프로젝트를 빌드하세요:Copy
- 구성 및 실행: 그런 다음
node dist/index.js
사용하여 컴파일된 코드를 직접 실행할 수 있습니다(GEMINI_API_KEY
환경 변수로 설정되어 있는지 확인). 또는node
명령과dist/index.js
의 절대 경로를 사용하여 MCP 클라이언트를 구성하여 이를 실행하고 npx 예제에서 볼 수 있듯이env
설정을 통해 API 키를 전달합니다.
구성
서버는 다음과 같은 환경 변수를 사용합니다.
GEMINI_API_KEY
(필수): Google Gemini API 키.GEMINI_MODEL_NAME
(선택 사항): 사용할 특정 Gemini 모델(예:gemini-1.5-flash
)입니다. 기본값은gemini-2.0-flash
입니다. 중요: 프로덕션 또는 상업적 용도로 사용하려면 "실험용" 또는 "미리보기"로 표시되지 않은 모델 버전을 선택해야 합니다.
환경 변수는 MCP 클라이언트 설정 파일의 env
섹션(예: mcp_settings.json
)에서 설정해야 합니다.
사용 가능한 도구
1. ask_about_youtube_video
영상에 대한 질문에 답하거나, 질문이 없는 경우 일반적인 설명을 제공합니다.
- 입력:
youtube_url
(문자열, 필수): YouTube 동영상의 URL입니다.question
(문자열, 선택 사항): 동영상에 대한 구체적인 질문입니다. 생략하면 일반적인 설명이 생성됩니다.
- 출력: 답변이나 설명이 포함된 텍스트.
2. summarize_youtube_video
주어진 YouTube 비디오의 요약을 생성합니다.
- 입력:
youtube_url
(문자열, 필수): YouTube 동영상의 URL입니다.summary_length
(문자열, 선택 사항): 원하는 요약 길이('short', 'medium', 'long'). 기본값은 'medium'입니다.
- 출력: 비디오 요약을 담은 텍스트.
3. extract_key_moments
YouTube 동영상에서 주요 순간(타임스탬프와 설명)을 추출합니다.
- 입력:
youtube_url
(문자열, 필수): YouTube 동영상의 URL입니다.number_of_moments
(정수, 선택 사항): 추출할 주요 순간의 개수입니다. 기본값은 3입니다.
- 출력: 타임스탬프가 포함된 주요 순간을 설명하는 텍스트입니다.
4. list_supported_models
REST API를 통해 가져온 generateContent
메서드를 지원하는 사용 가능한 Gemini 모델을 나열합니다.
- 입력: 없음
- 출력: 지원되는 모델 이름을 나열한 텍스트입니다.
중요 참고 사항
- 프로덕션용 모델 선택: 이 서버를 프로덕션 또는 상업적 목적으로 사용하는 경우, 선택한
GEMINI_MODEL_NAME
이 프로덕션 환경에 적합한 안정적인 버전인지 확인하십시오. Gemini API 서비스 약관 에 따라 "실험용" 또는 "미리보기"로 표시된 모델은 프로덕션 환경에 배포할 수 없습니다. - API 서비스 약관: 이 서버는 Google Gemini API를 기반으로 운영됩니다. 사용자는 Google API 서비스 약관 과 Gemini API 추가 서비스 약관 을 검토하고 준수할 책임이 있습니다. Gemini API의 무료 및 유료 버전 간에는 데이터 사용 정책이 다를 수 있습니다. 무료 버전을 사용할 때는 민감하거나 기밀 정보를 제출하지 마십시오.
- 콘텐츠 책임: Gemini API를 통해 생성된 콘텐츠의 정확성과 적합성은 보장되지 않습니다. 생성된 콘텐츠를 사용하거나 게시하기 전에 신중하게 판단하시기 바랍니다.
특허
이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 라이선스 파일을 참조하세요.
You must be authenticated.
Google Gemini Vision API를 활용하여 YouTube 동영상과 상호작용하는 MCP(Model Context Protocol) 서버입니다. 사용자는 YouTube 동영상에서 설명, 요약, 질문에 대한 답변을 얻고 주요 장면을 추출할 수 있습니다.