Deep Thinking LLM을 기반으로 자연스러운 서식, 상황에 맞는 복구, 스마트 요약 등의 기능을 갖춘 지능형 필사본 처리 기능을 제공하는 MCP 서버입니다.
사용 가능한 MCP 도구
이 MCP 서버는 전사 처리를 위한 4가지 강력한 도구를 제공합니다.
- repair_text - 90% 이상의 신뢰도로 필사 오류를 분석하고 복구합니다.
- get_repair_log - 이전 수리의 자세한 분석 로그를 검색합니다.
- format_transcript - 타임스탬프가 찍힌 대본을 자연스럽게 포맷된 텍스트로 변환합니다.
- summary_text - ACE 인지 방법론을 사용하여 지능형 요약을 생성합니다.
설치
Smithery를 통해 설치
Smithery를 통해 Claude Desktop용 Transcription Tools를 자동으로 설치하려면:
지엑스피1
- 이 저장소를 복제하세요:
git clone https://github.com/mushroomfleet/TranscriptionTools-MCP
cd TranscriptionTools-MCP
- 종속성 설치:
- 서버를 빌드하세요:
- MCP 설정 파일에서 MCP 서버를 구성하세요.
{
"mcpServers": {
"transcription-tools": {
"command": "node",
"args": ["/path/to/TranscriptionTools-MCP/build/index.js"],
"disabled": false,
"autoApprove": []
}
}
}
MCP 도구 사용
전사 오류 복구
<use_mcp_tool>
<server_name>transcription-tools</server_name>
<tool_name>repair_text</tool_name>
<arguments>
{
"input_text": "We recieve about ten thousand dollars which is defiantly not enough.",
"is_file_path": false
}
</arguments>
</use_mcp_tool>
타임스탬프가 찍힌 성적증명서 서식 지정
<use_mcp_tool>
<server_name>transcription-tools</server_name>
<tool_name>format_transcript</tool_name>
<arguments>
{
"input_text": "/path/to/timestamped-transcript.txt",
"is_file_path": true,
"paragraph_gap": 8,
"line_gap": 4
}
</arguments>
</use_mcp_tool>
요약 생성
<use_mcp_tool>
<server_name>transcription-tools</server_name>
<tool_name>summary_text</tool_name>
<arguments>
{
"input_text": "Long text to summarize...",
"is_file_path": false,
"constraint_type": "words",
"constraint_value": 100
}
</arguments>
</use_mcp_tool>
수리 로그 검색
<use_mcp_tool>
<server_name>transcription-tools</server_name>
<tool_name>get_repair_log</tool_name>
<arguments>
{
"session_id": "20241206143022"
}
</arguments>
</use_mcp_tool>
핵심 기술
자연스러운 서식
- 음성 패턴을 보존하면서 타임스탬프를 제거합니다.
- 일시 정지 기간에 따라 지능형 간격을 적용합니다.
- 자연스러운 문법과 언어 흐름을 존중합니다
- 정확한 필사 내용을 유지합니다
문맥적 복구
- 가능한 전사 오류를 식별하고 수정합니다.
- 높은 신뢰도의 수정을 위해 의미적 맥락을 사용합니다.
- 모든 변경 사항에 대한 자세한 로그를 유지합니다.
- 수정에 대한 90% 신뢰 임계값
- 원본 오디오가 필요하지 않습니다
스마트 요약
- 처리된 필사본의 간결한 요약을 작성합니다.
- 다양한 제약 유형을 지원합니다.
- 주요 정보와 맥락을 보존합니다
- 자연스러운 말하기 리듬을 유지합니다
프로젝트 구조
/
├── .gitignore # Git ignore file
├── LICENSE # MIT license file
├── README.md # This documentation
├── package.json # Package dependencies and scripts
├── tsconfig.json # TypeScript configuration
├── build/ # Compiled JavaScript files (generated after build)
│ ├── tools/ # Compiled tool implementations
│ └── utils/ # Compiled utility functions
└── src/ # Source TypeScript files
├── index.ts # MCP server entry point
├── tools/ # Tool implementations
│ ├── formatting.ts
│ ├── repair.ts
│ └── summary.ts
└── utils/ # Utility functions
├── file-handler.ts
└── logger.ts
구성
소스 코드를 직접 수정하여 서버 동작을 사용자 지정할 수 있습니다. 주요 구성 매개변수는 해당 도구 구현 파일에서 확인할 수 있습니다.
// In src/tools/formatting.ts
const paragraph_gap = 8; // seconds
const line_gap = 4; // seconds
// In src/tools/repair.ts
const confidence_threshold = 90; // percentage
// In src/tools/summary.ts
const default_speaking_pace = 150; // words per minute
특허
MIT