AivisSpeech MCP 서버
AivisSpeech 용 Model Context Protocol (MCP) 서버의 구현입니다. 이 서버는 AivisSpeech Engine과 연동하여 음성 합성을 위한 인터페이스를 제공합니다. MCP 프로토콜을 통해 AI 어시스턴트와 같은 애플리케이션에서 AivisSpeech의 음성 합성 기능을 쉽게 이용할 수 있습니다.
개요
AivisSpeech MCP 서버는 다음 기능을 제공합니다.
- MCP 프로토콜을 준수하는 API 엔드포인트
- AivisSpeech Engine과의 협력을 통한 고품질 음성 합성
- TypeScript를 사용한 유형 안전 설계
- 간단한 구성과 확장성이 높은 아키텍처
요건
- Node.js 18.x 이상
- npm 9.x 이상
- AivisSpeech Engine(별도 설치 필요)
설치
환경설정
.env
파일에서 다음 설정을 수행합니다.
커서 MCP 설정
.cursor/mcp.json
파일에서 다음 설정을 수행합니다.
/path/to/aivis-speech-mcp/dist/index.js
를 실제 프로젝트 경로로 다시 작성하십시오. Windows의 경우 백슬래시를 이스케이프하거나 앞으로 슬래시를 사용합니다. 예: "C:/Users/username/path/to/aivis-speech-mcp/dist/index.js"
사용법
개발 모드
개발 중에는 다음 명령을 사용하여 핫 재로드 기능으로 서버를 시작할 수 있습니다.
빌드
프로덕션 환경용으로 빌드하려면 다음 명령을 실행합니다.
프로덕션 모드
빌드 후 다음 명령으로 프로덕션 모드로 서버를 시작합니다.
테스트
테스트를 실행하려면 다음 명령을 사용합니다.
아키텍처
AivisSpeech MCP 서버는 다음 구성 요소로 구성됩니다.
- MCP 서비스 : Model Context Protocol을 준수하는 서버를 제공하고 클라이언트의 요청을 처리합니다.
- AivisSpeech 서비스 : AivisSpeech Engine의 API와 통신하여 음성 합성을 수행합니다.
API 사양
MCP 프로토콜을 준수하는 API 엔드포인트를 제공합니다. 주요 기능은 다음과 같습니다.
- 음성 합성(텍스트에서 음성 생성)
- 스피커 정보 얻기
- 음성 스타일 설정
자세한 API 사양은 AivisSpeech Engine API 사양을 참조하십시오.
MCP 프로토콜과의 협력
이 서버는 Model Context Protocol(MCP)을 구현하며 AI 어시스턴트와 같은 애플리케이션에서 원활하게 사용할 수 있습니다. MCP 프로토콜에 대한 자세한 내용은 MCP 공식 문서 를 참조하십시오.
문제해결
일반적인 문제와 해결책:
- AivisSpeech Engine에 연결할 수 없습니다 .
.env
파일의AIVIS_SPEECH_API_URL
올바르게 설정되어 있는지 확인하십시오. - 오디오가 재생되지 않음 : 시스템의 오디오 설정을 확인하고 적절한 오디오 장치가 선택되어 있는지 확인합니다.
- 스피커 ID를 찾을 수 없음 : AivisSpeech Engine이 올바르게 시작되었는지 확인하고 사용 가능한 스피커 ID를 확인하십시오.
기여
버그 보고 및 기능 요청은 GitHub의 Issue 추적기를 통해 요청합니다. 풀 요청도 환영합니다.
라이센스
감사의 말
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
A Model Context Protocol server that enables AI assistants to utilize AivisSpeech Engine's high-quality voice synthesis capabilities through a standardized API interface.
Related MCP Servers
- -securityAlicense-qualityA server that enables Claude 3.7 and other AI agents to access VOICEVOX-compatible speech synthesis engines (AivisSpeech, VOICEVOX, COEIROINK) through the Model Context Protocol.Last updated -2TypeScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI assistants to generate images, text, and audio through the Pollinations APIs without requiring authentication.Last updated -74819JavaScriptMIT License
- AsecurityAlicenseAqualityA Model Context Protocol server that enables AI models to generate and play high-quality text-to-speech audio through your device's native audio system using Rime's voice synthesis API.Last updated -1154JavaScriptThe Unlicense
- -securityAlicense-qualityA Model Context Protocol server that enables AI assistants like Claude to initiate and manage real-time voice calls using Twilio and OpenAI's voice models.Last updated -14TypeScriptMIT License