MCP 이미지 추출기
LLM 분석을 위해 이미지를 추출하고 base64로 변환하는 MCP 서버입니다.
이 MCP 서버는 AI 어시스턴트에게 다음과 같은 도구를 제공합니다.
- 로컬 파일에서 이미지 추출
- URL에서 이미지 추출
- base64로 인코딩된 이미지 처리
커서에서 보이는 모습:
적합한 경우:
- 극작가 테스트 결과 분석: 스크린샷
커서 또는 다른 클라이언트의 경우
수동 설치
지엑스피1
이렇게 하면 mcp-image-extractor
명령을 전역적으로 사용할 수 있습니다.
.cursor/mcp.json 파일 사용
로컬 개발이나 특정 프로젝트에서 작업하는 경우 프로젝트 루트에 .cursor/mcp.json
파일을 추가할 수 있습니다.
또는 npm 링크를 통해 설치한 경우:
커서 사용자를 위한 중요 참고 사항 : "클라이언트 생성 실패" 오류가 표시되면 다음 대안을 시도해 보세요.
옵션 1: GitHub 직접 설치 사용
그런 다음
.cursor/mcp.json
에서 구성합니다.옵션 2: 로컬에서 복제하고 실행
그런 다음
.cursor/mcp.json
에서 구성합니다.
사용 가능한 도구
파일에서 이미지 추출
로컬 파일에서 이미지를 추출하여 base64로 변환합니다.
매개변수:
file_path
(필수): 로컬 이미지 파일 경로
참고: 모든 이미지는 LLM 분석을 위해 최적의 크기(최대 512x512)로 자동 조정되어 base64 출력 크기를 제한하고 컨텍스트 창 사용을 최적화합니다.
URL에서 이미지 추출
URL에서 이미지를 추출하여 base64로 변환합니다.
매개변수:
url
(필수): 추출할 이미지의 URL
참고: 모든 이미지는 LLM 분석을 위해 최적의 크기(최대 512x512)로 자동 조정되어 base64 출력 크기를 제한하고 컨텍스트 창 사용을 최적화합니다.
base64에서 이미지 추출
LLM 분석을 위해 base64로 인코딩된 이미지를 처리합니다.
매개변수:
base64
(필수): Base64로 인코딩된 이미지 데이터mime_type
(선택 사항, 기본값: "image/png"): 이미지의 MIME 유형
참고: 모든 이미지는 LLM 분석을 위해 최적의 크기(최대 512x512)로 자동 조정되어 base64 출력 크기를 제한하고 컨텍스트 창 사용을 최적화합니다.
사용 예
다음은 Claude의 도구를 사용하는 방법의 예입니다.
Claude는 extract_image_from_file
도구를 자동으로 사용하여 이미지 콘텐츠를 로드하고 분석합니다.
클로드는 extract_image_from_url
도구를 자동으로 사용하여 이미지 콘텐츠를 가져와 분석합니다.
도커
Docker로 빌드하고 실행:
특허
MIT
Related MCP Servers
- -securityAlicense-qualityA Model Context Protocol server that allows LLMs to interact with web content through standardized tools, currently supporting web scraping functionality.Last updated -PythonMIT License
- -securityFlicense-qualityA Model Context Protocol server that enables LLMs to extract and use content from unstructured documents across a wide variety of file formats.Last updated -6Python
- AsecurityAlicenseAqualityA Model Context Protocol server that enables fetching and processing images from URLs, local file paths, and numpy arrays, returning them as base64-encoded strings with proper MIME types.Last updated -16PythonMIT License
- AsecurityFlicenseAqualityA Model Context Protocol server that enables LLMs to fetch and process web content in multiple formats (HTML, JSON, Markdown, text) with automatic format detection.Last updated -54TypeScript