remote-capable server
The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.
Integrations
Provides secure public URL tunneling to make the server accessible for Twilio's webhook callbacks during calls
Processes real-time call audio using OpenAI's realtime model to enable natural voice conversations and responds with generated voice streams
Allows placing outbound phone calls, receiving call status updates, and handling real-time audio through Twilio's telephony services
음성 통화 MCP 서버
Claude와 다른 AI 어시스턴트가 Twilio와 OpenAI(GPT-4o 실시간 모델)를 사용하여 음성 통화를 시작하고 관리할 수 있도록 하는 MCP(Model Context Protocol) 서버입니다.
이를 기반으로 AI 기반 음성 통화 탐색을 시작하고, 시간을 절약하며, 이를 바탕으로 추가 기능을 개발하세요.
시퀀스 다이어그램
지엑스피1
특징
- Twilio를 통해 발신 전화 걸기 📞
- GPT-4o Realtime 모델을 사용하여 실시간으로 통화 오디오를 처리하세요 🎙️
- 통화 중 실시간 언어 전환 🌐
- 일반적인 통화 시나리오(예: 레스토랑 예약)에 대한 미리 작성된 프롬프트 🍽️
- ngrok를 사용한 자동 공개 URL 터널링 🔄
- 자격 증명의 안전한 처리 🔒
왜 MCP인가?
모델 컨텍스트 프로토콜(MCP)은 AI 비서와 실제 행동 간의 간극을 메웁니다. 이 서버는 MCP를 구현함으로써 Claude와 같은 AI 모델이 다음을 수행할 수 있도록 지원합니다.
- 사용자를 대신하여 실제 전화 통화를 시작합니다.
- 실시간 오디오 대화를 처리하고 응답합니다.
- 음성 통신이 필요한 복잡한 작업 실행
이 오픈소스 구현은 투명성과 사용자 정의 기능을 제공하므로 개발자는 데이터와 개인 정보에 대한 제어를 유지하면서 기능을 확장할 수 있습니다.
요구 사항
- 노드.js >= 22
- Node.js를 업데이트해야 하는 경우
nvm
(Node Version Manager)을 사용하는 것이 좋습니다.Copy
- Node.js를 업데이트해야 하는 경우
- API 자격 증명이 있는 Twilio 계정
- OpenAI API 키
- Ngrok 인증 토큰
설치
수동 설치
- 저장소를 복제합니다Copy
- 종속성을 설치하고 빌드합니다.Copy
구성
서버에는 여러 환경 변수가 필요합니다.
TWILIO_ACCOUNT_SID
: Twilio 계정 SIDTWILIO_AUTH_TOKEN
: Twilio 인증 토큰TWILIO_NUMBER
: 귀하의 Twilio 번호OPENAI_API_KEY
: OpenAI API 키NGROK_AUTHTOKEN
: NGROK 인증 토큰RECORD_CALLS
: 통화를 녹음하려면 "true"로 설정합니다(선택 사항)
클로드 데스크톱 구성
Claude Desktop과 함께 이 서버를 사용하려면 구성 파일에 다음을 추가하세요.
macOS : ~/Library/Application Support/Claude/claude_desktop_config.json
윈도우 : %APPDATA%\Claude\claude_desktop_config.json
그런 다음 Claude Desktop을 다시 시작하여 구성을 다시 로드하세요. 연결되면 🔨 메뉴 아래에 음성 통화가 표시됩니다.
Claude와의 상호 작용 예시
클로드를 통해 서버와 상호 작용하는 몇 가지 자연스러운 방법은 다음과 같습니다.
- 간단한 통화:
- 레스토랑 예약:
- 약속 일정:
중요 참고 사항
- 전화번호 형식 : 모든 전화번호는 E.164 형식이어야 합니다(예: +11234567890)
- 요금 제한 : Twilio 및 OpenAI 계정의 요금 제한 및 가격을 알고 있어야 합니다.
- 음성 대화 : AI가 실시간으로 자연스러운 대화를 처리합니다.
- 통화 기간 : OpenAI API 및 Twilio 비용에 영향을 미치므로 통화 기간을 주의하세요.
- 공개 노출 : ngrok 터널은 Twilio가 서버에 접근할 수 있도록 서버를 공개적으로 노출합니다(다만 무작위 URL을 사용하고 무작위 비밀로 보호).
문제 해결
일반적인 오류 메시지 및 해결 방법:
- "전화번호는 E.164 형식이어야 합니다."
- 전화번호가 "+"로 시작하고 국가 코드가 포함되어 있는지 확인하세요.
- "잘못된 자격 증명입니다"
- TWILIO_ACCOUNT_SID와 TWILIO_AUTH_TOKEN을 다시 한번 확인하세요. Twilio 콘솔 에서 복사할 수 있습니다.
- "OpenAI API 오류"
- OPENAI_API_KEY가 올바르고 충분한 크레딧이 있는지 확인하세요.
- "Ngrok 터널이 시작되지 않았습니다"
- NGROK_AUTHTOKEN이 유효하고 만료되지 않았는지 확인하세요.
- "OpenAI Realtime이 음성 입력의 끝을 감지하지 못하거나 지연됩니다."
- Twilio와 수신자의 네트워크 사업자 간에 음성 인코딩 문제가 발생할 수 있습니다. 다른 수신자를 사용해 보세요.
기여하다
여러분의 참여를 환영합니다! 저희가 개선하고자 하는 부분은 다음과 같습니다.
- 현재 구현을 넘어 다양한 AI 모델에 대한 지원을 구현합니다.
- 대화 내역을 로컬에 저장하고 AI 컨텍스트에서 액세스할 수 있도록 데이터베이스 통합을 추가합니다.
- 통화 경험을 향상시키기 위해 대기 시간과 응답 시간을 개선하세요
- 오류 처리 및 복구 메커니즘 강화
- 일반적인 시나리오에 맞춰 미리 작성된 대화 템플릿을 더 추가하세요.
- 향상된 통화 모니터링 및 분석 구현
참여하고 싶으시다면 풀 리퀘스트를 제출하기 전에 이슈를 열어 아이디어에 대해 논의해 주세요.
특허
이 프로젝트는 MIT 라이선스에 따라 라이선스가 부여되었습니다. 자세한 내용은 라이선스 파일을 참조하세요.
보안
GitHub 이슈나 풀 리퀘스트에 전화번호나 API 자격 증명과 같은 민감한 정보를 포함하지 마세요. 이 서버는 민감한 통신을 처리하므로, 책임감 있게 배포하고 모든 자격 증명이 안전하게 보관되도록 하세요.
새로운 임무를 시작할 때가 되었나요?
우리는 음성 AI의 최전선에서 일할 엔지니어를 채용하고 있으며, 이를 차세대 통신 회사에 적용할 예정입니다.
궁금하세요? careers.popcorn.space 로 가보세요 🍿!
This server cannot be installed
Twilio와 OpenAI의 음성 모델을 사용하여 Claude와 같은 AI 비서가 실시간 음성 통화를 시작하고 관리할 수 있도록 하는 모델 컨텍스트 프로토콜 서버입니다.