🌙 Moondream MCP 서버
Moondream 비전 모델을 사용하여 애플리케이션에 고급 이미지 분석 기능을 제공하는 강력한 모델 컨텍스트 프로토콜(MCP) 서버입니다. 이 서버는 Claude and Cline과 완벽하게 통합되어 AI 어시스턴트와 정교한 컴퓨터 비전 작업을 연결하는 다리 역할을 합니다.
이것은 공식적인 Moondream 패키지가 아닙니다. 소비자용 하드웨어에서 실행할 수 있는 최고의 오픈 소스 비전 모델을 만든 moondream.ai 에게 모든 영광을 돌립니다.
✨ 특징
🖼️ 이미지 캡션 생성 : 이미지에 대한 자연어 설명 생성
🔍 객체 감지 : 이미지 내에서 특정 객체를 식별하고 찾습니다.
💭 시각적 질의응답 : 이미지 콘텐츠에 대한 질문을 하고 지능적인 답변을 받으세요
🚀 고성능 : 효율적인 추론을 위해 양자화된 8비트 모델을 사용합니다.
🔄 자동 설정 : 모델 다운로드 및 환경 설정을 처리합니다.
🛠️ MCP 통합 : 원활한 도구 사용을 위한 표준화된 프로토콜
Related MCP server: Image Toolkit MCP Server
🎯 사용 사례
콘텐츠 분석 : 이미지 콘텐츠에 대한 설명을 자동으로 생성합니다.
접근성 : 시각 장애인 사용자를 위한 대체 텍스트 만들기
데이터 추출 : 타겟 질문을 통해 이미지에서 특정 정보 추출
객체 검증 : 이미지에서 특정 객체의 존재를 확인합니다.
장면 이해 : 복잡한 장면과 그 구성 요소를 분석합니다.
🚀 빠른 시작
필수 조건
Node.js v18 이상
파이썬 3.8 이상
UV 패키지 관리자(없으면 자동으로 설치됨)
설치
복제 및 설정
지엑스피1
서버 구축
나머지 작업은 서버가 자동으로 처리합니다.
Python 가상 환경을 생성합니다
UV가 없으면 설치합니다.
Moondream 모델을 다운로드하고 설정합니다.
모델 서버 프로세스를 관리합니다
Claude/Cline과의 통합
MCP 설정 파일( claude_desktop_config.json 또는 cline_mcp_settings.json )에 다음을 추가합니다.
🛠️ 사용 가능한 도구
분석_이미지
다양한 모드를 갖춘 강력한 이미지 분석 도구:
프롬프트 유형:
"generate caption"- 자연어 설명을 생성합니다."detect: [object]"- 특정 객체를 찾습니다(예: "detect: car")"[question]"- 이미지에 대한 질문에 답변합니다.
예:
🔧 기술 세부 사항
건축학
서버는 이중 구성 요소 시스템으로 작동합니다.
MCP 인터페이스 계층
프로토콜 통신을 처리합니다
도구 인터페이스를 관리합니다
요청/응답을 처리합니다
문드림 모델 서버
비전 모델을 실행합니다
이미지 분석을 처리합니다
HTTP API 엔드포인트를 제공합니다
모델 정보
Moondream 양자화 모델을 사용합니다.
기본값:
moondream-2b-int8.mf.gz효율적인 8비트 양자화
Hugging Face에서 자동 다운로드
~500MB 모델 크기
성능
자동 캐싱으로 빠른 시작
양자화를 통한 효율적인 메모리 사용
반응형 API 엔드포인트
동시 요청 처리
🔍 디버깅
일반적인 문제 및 해결 방법:
모델 다운로드 문제
# Manual model download wget https://huggingface.co/vikhyatk/moondream2/resolve/main/moondream-0_5b-int4.mf.gz서버 포트 충돌
기본 포트: 3475
lsof -i :3475사용하여 프로세스를 확인하세요.
파이썬 환경
UV는 종속성을 관리합니다
임시 디렉토리의 로그 확인
시스템 임시 폴더의 가상 환경
🤝 기여하기
참여를 환영합니다! 관심 분야:
추가 모델 지원
성능 최적화
새로운 분석 기능
문서 개선
📄 라이센스
[여기에 라이센스 정보를 추가하세요]
🙏 감사의 말
모델 컨텍스트 프로토콜(MCP) 커뮤니티
기여자 및 유지 관리자