MCP 비디오 인식 서버
Google의 Gemini AI를 사용하여 이미지, 오디오, 비디오 인식을 위한 도구를 제공하는 MCP(Model Context Protocol) 서버입니다.
특징
- 이미지 인식 : Google Gemini AI를 사용하여 이미지를 분석하고 설명합니다.
- 오디오 인식 : Google Gemini AI를 사용하여 오디오 분석 및 필사
- 비디오 인식 : Google Gemini AI를 사용하여 비디오를 분석하고 설명합니다.
필수 조건
- Node.js 18 이상
- Google Gemini API 키
설치
수동 설치
- 저장소를 복제합니다.지엑스피1
- 종속성 설치:Copy
- 프로젝트를 빌드하세요:Copy
FLUJO에 설치하기
- 서버 추가를 클릭하세요
- Github URL을 복사하여 FLUJO에 붙여넣기
- 분석, 복제, 설치, 빌드 및 저장을 클릭합니다.
구성 파일을 통한 설치
구성 파일을 통해 이 MCP 서버를 Cline이나 다른 MCP 클라이언트와 통합하려면:
- Cline 설정을 엽니다.
- VS Code에서 파일 -> 환경 설정 -> 설정으로 이동합니다.
- "Cline MCP 설정"을 검색하세요
- "settings.json에서 편집"을 클릭하세요.
mcpServers
개체에 서버 구성을 추가합니다.Copy/path/to/mcp-video-recognition/dist/index.js
프로젝트 디렉터리에 있는index.js
파일의 실제 경로로 바꾸세요. Windows에서는 경로에 슬래시(/) 또는 이중 백슬래시(\\)를 사용하세요.- 설정 파일을 저장하세요. Cline이 자동으로 서버에 연결될 것입니다.
구성
서버는 환경 변수를 사용하여 구성됩니다.
GOOGLE_API_KEY
(필수): Google Gemini API 키TRANSPORT_TYPE
: 사용할 전송 유형(stdio
또는sse
, 기본값은stdio
)PORT
: SSE 전송을 위한 포트 번호(기본값은 3000)LOG_LEVEL
: 로깅 수준(verbose
,debug
,info
,warn
,error
, 기본값은info
)
용법
서버 시작
stdio 전송(기본값)
Copy
SSE 운송과 함께
Copy
도구 사용
서버는 MCP 클라이언트가 호출할 수 있는 세 가지 도구를 제공합니다.
이미지 인식
Copy
오디오 인식
Copy
비디오 인식
Copy
도구 매개변수
모든 도구는 다음 매개변수를 허용합니다.
filepath
(필수): 분석할 미디어 파일의 경로prompt
(선택 사항): 인식을 위한 사용자 정의 프롬프트(기본값은 "이 콘텐츠를 설명하세요")modelname
(선택 사항): 인식에 사용할 Gemini 모델(기본값은 "gemini-2.0-flash")
개발
개발 모드에서 실행
Copy
프로젝트 구조
src/index.ts
: 진입점src/server.ts
: MCP 서버 구현src/tools/
: 도구 구현src/services/
: 서비스 구현(Gemini API)src/types/
: 유형 정의src/utils/
: 유틸리티 함수
특허
MIT
This server cannot be installed
모델 컨텍스트 프로토콜을 통해 Google의 Gemini AI를 사용하여 이미지, 오디오, 비디오 인식을 위한 도구를 제공합니다.