mcp-youtube-transcript

by sinco-lab
Verified

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Enables retrieval of transcripts from YouTube videos with support for multiple languages, formatting options, and metadata extraction including video titles, timestamps, and automatic paragraph segmentation.

Servidor de transcripciones de YouTube de MCP

Un servidor de Protocolo de Contexto de Modelo que permite la recuperación de transcripciones de vídeos de YouTube. Este servidor proporciona acceso directo a las transcripciones de vídeo mediante una interfaz sencilla, lo que lo hace ideal para el análisis y procesamiento de contenido.

Tabla de contenido

Características

✨ Capacidades clave:

  • Extraer transcripciones de vídeos de YouTube
  • Soporte para múltiples idiomas
  • Formatear texto con modo continuo o de párrafo
  • Recuperar títulos y metadatos de vídeos
  • Segmentación automática de párrafos
  • Normalización de texto y decodificación de entidades HTML
  • Manejo robusto de errores
  • Detección de marcas de tiempo y superposición

Empezando

Prerrequisitos

  • Node.js 18 o superior

Instalación

Ofrecemos dos métodos de instalación:

Opción 1: Configuración manual (recomendada para producción)

  1. Cree o edite el archivo de configuración de Claude Desktop:
    • macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
    • Ventanas: %APPDATA%\Claude\claude_desktop_config.json
  2. Agregue la siguiente configuración:
{ "mcpServers": { "youtube-transcript": { "command": "npx", "args": [ "-y", "@sinco-lab/mcp-youtube-transcript" ] } } }

Script de configuración rápida para macOS:

# Create directory if it doesn't exist mkdir -p ~/Library/Application\ Support/Claude # Create or update config file cat > ~/Library/Application\ Support/Claude/claude_desktop_config.json << 'EOL' { "mcpServers": { "youtube-transcript": { "command": "npx", "args": [ "-y", "@sinco-lab/mcp-youtube-transcript" ] } } } EOL

Opción 2: Vía Herrería (Solo Desarrollo)

npx -y @smithery/cli install @sinco-lab/mcp-youtube-transcript --client claude

⚠️ Nota : Este método no se recomienda para uso en producción ya que depende de los servicios de proxy de Smithery.

Uso

Configuración básica

Para utilizar con Claude Desktop/Cursor/cline, asegúrese de que su configuración coincida:

{ "mcpServers": { "youtube-transcript": { "command": "npx", "args": ["-y", "@sinco-lab/mcp-youtube-transcript"] } } }

Pruebas

Con la aplicación Claude

  1. Reinicie la aplicación Claude después de la instalación
  2. Prueba con un comando simple:
    https://www.youtube.com/watch?v=AJpK3YTTKZ4 Summarize this video

Ejemplo de salida:

Con MCP Inspector

# Clone and setup git clone https://github.com/sinco-lab/mcp-youtube-transcript.git cd mcp-youtube-transcript npm install npm run build # Launch inspector npx @modelcontextprotocol/inspector node "dist/index.js" # Access http://localhost:5173 and try these commands: # 1. List Tools: clink `List Tools` # 2. Test get_transcripts with: # url: "https://www.youtube.com/watch?v=AJpK3YTTKZ4" # lang: "en" (optional) # enableParagraphs: false (optional)

Solución de problemas y mantenimiento

Comprobación de los registros de Claude

Para supervisar los registros de Claude, puede utilizar el siguiente comando:

tail -n 20 -f ~/Library/Logs/Claude/mcp*.log

Esto mostrará las últimas 20 líneas del archivo de registro y continuará mostrando nuevas entradas a medida que se agreguen.

Nota : La aplicación Claude prefija automáticamente los archivos de registro del servidor MCP con mcp-server- . Por ejemplo, los registros de nuestro servidor se escribirán en mcp-server-youtube-transcript.log .

Limpieza de la caché npx

Si encuentra problemas relacionados con el caché npx , puede limpiarlo manualmente usando:

rm -rf ~/.npm/_npx

Esto eliminará los paquetes almacenados en caché y le permitirá comenzar de nuevo.

Referencia de API

obtener_transcripciones

Obtiene transcripciones de vídeos de YouTube.

Parámetros:

  • url (cadena, obligatoria): URL o ID del video de YouTube
  • lang (cadena, opcional): Código de idioma (predeterminado: "en")
  • enableParagraphs (booleano, opcional): Habilitar el modo de párrafo (predeterminado: falso)

Formato de respuesta:

{ "content": [{ "type": "text", "text": "Video title and transcript content", "metadata": { "videoId": "video_id", "title": "video_title", "language": "transcript_language", "timestamp": "processing_time", "charCount": "character_count", "transcriptCount": "number_of_transcripts", "totalDuration": "total_duration", "paragraphsEnabled": "paragraph_mode_status" } }] }

Desarrollo

Estructura del proyecto

├── src/ │ ├── index.ts # Server entry point │ ├── youtube.ts # YouTube transcript fetching logic ├── dist/ # Compiled output └── package.json

Componentes clave

  • YouTubeTranscriptFetcher : Funcionalidad principal para obtener transcripciones
  • YouTubeUtils : Procesamiento de texto y utilidades

Características y capacidades

  • Manejo de errores:
    • URL/ID no válidos
    • Transcripciones no disponibles
    • Disponibilidad de idiomas
    • Errores de red
    • Limitación de velocidad
  • Procesamiento de texto:
    • Decodificación de entidades HTML
    • Normalización de la puntuación
    • Normalización espacial
    • Detección inteligente de párrafos

Contribuyendo

¡Agradecemos las contribuciones! No dudes en enviar problemas y solicitudes de incorporación de cambios.

Licencia

Este proyecto está licenciado bajo la licencia MIT: consulte el archivo de LICENCIA para obtener más detalles.

Proyectos relacionados

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

Un servidor de Protocolo de Contexto de Modelo que permite la recuperación de transcripciones de vídeos de YouTube. Este servidor proporciona acceso directo a las transcripciones y subtítulos de los vídeos mediante una interfaz sencilla, lo que lo hace ideal para el análisis y procesamiento de contenido.

  1. Table of Contents
    1. Features
      1. Getting Started
        1. Prerequisites
        2. Installation
      2. Usage
        1. Basic Configuration
        2. Testing
        3. Troubleshooting and Maintenance
      3. API Reference
        1. get_transcripts
      4. Development
        1. Project Structure
        2. Key Components
        3. Features and Capabilities
      5. Contributing
        1. License
          1. Related Projects
            ID: dkxb9huvl6