AivisSpeech MCP 서버
AivisSpeech 용 Model Context Protocol (MCP) 서버의 구현입니다. 이 서버는 AivisSpeech Engine과 연동하여 음성 합성을 위한 인터페이스를 제공합니다. MCP 프로토콜을 통해 AI 어시스턴트와 같은 애플리케이션에서 AivisSpeech의 음성 합성 기능을 쉽게 이용할 수 있습니다.
개요
AivisSpeech MCP 서버는 다음 기능을 제공합니다.
- MCP 프로토콜을 준수하는 API 엔드포인트
- AivisSpeech Engine과의 협력을 통한 고품질 음성 합성
- TypeScript를 사용한 유형 안전 설계
- 간단한 구성과 확장성이 높은 아키텍처
요건
- Node.js 18.x 이상
- npm 9.x 이상
- AivisSpeech Engine(별도 설치 필요)
설치
환경설정
.env
파일에서 다음 설정을 수행합니다.
커서 MCP 설정
.cursor/mcp.json
파일에서 다음 설정을 수행합니다.
/path/to/aivis-speech-mcp/dist/index.js
를 실제 프로젝트 경로로 다시 작성하십시오. Windows의 경우 백슬래시를 이스케이프하거나 앞으로 슬래시를 사용합니다. 예: "C:/Users/username/path/to/aivis-speech-mcp/dist/index.js"
사용법
개발 모드
개발 중에는 다음 명령을 사용하여 핫 재로드 기능으로 서버를 시작할 수 있습니다.
빌드
프로덕션 환경용으로 빌드하려면 다음 명령을 실행합니다.
프로덕션 모드
빌드 후 다음 명령으로 프로덕션 모드로 서버를 시작합니다.
테스트
테스트를 실행하려면 다음 명령을 사용합니다.
아키텍처
AivisSpeech MCP 서버는 다음 구성 요소로 구성됩니다.
- MCP 서비스 : Model Context Protocol을 준수하는 서버를 제공하고 클라이언트의 요청을 처리합니다.
- AivisSpeech 서비스 : AivisSpeech Engine의 API와 통신하여 음성 합성을 수행합니다.
API 사양
MCP 프로토콜을 준수하는 API 엔드포인트를 제공합니다. 주요 기능은 다음과 같습니다.
- 음성 합성(텍스트에서 음성 생성)
- 스피커 정보 얻기
- 음성 스타일 설정
자세한 API 사양은 AivisSpeech Engine API 사양을 참조하십시오.
MCP 프로토콜과의 협력
이 서버는 Model Context Protocol(MCP)을 구현하며 AI 어시스턴트와 같은 애플리케이션에서 원활하게 사용할 수 있습니다. MCP 프로토콜에 대한 자세한 내용은 MCP 공식 문서 를 참조하십시오.
문제해결
일반적인 문제와 해결책:
- AivisSpeech Engine에 연결할 수 없습니다 .
.env
파일의AIVIS_SPEECH_API_URL
올바르게 설정되어 있는지 확인하십시오. - 오디오가 재생되지 않음 : 시스템의 오디오 설정을 확인하고 적절한 오디오 장치가 선택되어 있는지 확인합니다.
- 스피커 ID를 찾을 수 없음 : AivisSpeech Engine이 올바르게 시작되었는지 확인하고 사용 가능한 스피커 ID를 확인하십시오.
기여
버그 보고 및 기능 요청은 GitHub의 Issue 추적기를 통해 요청합니다. 풀 요청도 환영합니다.
라이센스
감사의 말
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
A Model Context Protocol server that enables AI assistants to utilize AivisSpeech Engine's high-quality voice synthesis capabilities through a standardized API interface.
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that allows AI assistants to interact with the VRChat API, enabling retrieval of user information, friends lists, and other VRChat data through a standardized interface.Last updated -18641TypeScriptMIT License
- -securityFlicense-qualityA comprehensive Model Context Protocol server implementation that enables AI assistants to interact with file systems, databases, GitHub repositories, web resources, and system tools while maintaining security and control.Last updated -31TypeScript
- AsecurityFlicenseAqualityA Model Context Protocol server that enables AI assistants to interact with the Omi API for retrieving and creating conversations and memories for users.Last updated -42TypeScript
- AsecurityAlicenseAqualityA Model Context Protocol server that integrates with AivisSpeech to enable AI assistants to convert text to natural-sounding Japanese speech with customizable voice parameters.Last updated -15997JavaScriptApache 2.0