Servidor MCP de Markdownify: UTF-8 mejorado
Esta es una versión mejorada del proyecto Markdownify MCP original , con soporte de codificación UTF-8 mejorado y manejo optimizado de contenido multilingüe.
Mejoras
Se agregó soporte integral para codificación UTF-8
Manejo optimizado de contenido multilingüe
Se solucionaron problemas de codificación en sistemas Windows
Mecanismos mejorados de gestión de errores
Diferencias clave con el proyecto original
Soporte de codificación mejorado:
Compatibilidad total con UTF-8 en todas las operaciones
Manejo adecuado de caracteres chinos, japoneses, coreanos y otros caracteres no ASCII
Se solucionaron problemas de codificación específicos de Windows (compatibilidad con cmd.exe y PowerShell)
Manejo de errores mejorado:
Mensajes de error detallados tanto en inglés como en chino
Mejor manejo de excepciones para problemas de red
Mecanismos de respaldo elegantes para fallos de conversión
Funcionalidad extendida:
Se agregó soporte para el procesamiento por lotes de múltiples archivos
Manejo mejorado de transcripciones de videos de YouTube
Extracción de metadatos mejorada de varios formatos de archivo
Mejor conservación del formato del documento
Optimizaciones de rendimiento:
Uso de memoria optimizado para conversiones de archivos grandes
Procesamiento más rápido de contenido multilingüe
Reducción de los conflictos de dependencia
Mejor experiencia de desarrollo:
Opciones de depuración integrales
Sistema de registro detallado
Soporte de configuración específica del entorno
Documentación clara tanto en inglés como en chino
Características
Admite la conversión de varios tipos de archivos a Markdown:
Archivos PDF
Imágenes (con metadatos)
Audio (con transcripción)
Documentos de Word (DOCX)
Hojas de cálculo de Excel (XLSX)
Presentaciones de PowerPoint (PPTX)
Contenido web:
Transcripciones de vídeos de YouTube
Resultados de la búsqueda
Páginas web generales
Archivos Markdown existentes
Inicio rápido
Clonar este repositorio:
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8Instalar dependencias:
pnpm installNota: Esto también instalará
uvy las dependencias de Python relacionadas.Construir el proyecto:
pnpm run buildIniciar el servidor:
pnpm start
Requisitos
Node.js 16.0 o superior
Python 3.8 o superior
gestor de paquetes pnpm
Git
Guía de instalación detallada
1. Configuración del entorno
Instalar Node.js:
Descargar desde el sitio web oficial de Node.js
Verificar la instalación:
node --version
Instalar pnpm:
npm install -g pnpm pnpm --versionInstalar Python:
Descargar desde el sitio web oficial de Python
Asegúrese de que Python se agregue a PATH durante la instalación
Verificar la instalación:
python --version
(Solo Windows) Configurar la compatibilidad con UTF-8:
# Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001
2. Configuración del proyecto
Clonar el repositorio:
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8Crear y activar el entorno virtual de Python:
# Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activateInstalar dependencias del proyecto:
# Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.shConstruir el proyecto:
pnpm run build
3. Verificación
Iniciar el servidor:
pnpm startPruebe la instalación:
# Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"
Guía de uso
Uso básico
Conversión de páginas web:
python convert_utf8.py "https://example.com"El Markdown convertido se guardará como
converted_result.mdConversión de archivos locales:
# Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"Conversión de vídeos de YouTube:
python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"
Uso avanzado
Variables de entorno:
# Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"Procesamiento por lotes: cree un archivo por lotes (por ejemplo,
convert_batch.txt) con URL o rutas de archivo:https://example1.com https://example2.com file1.docx file2.pdfLuego ejecuta:
while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt
Solución de problemas
Problemas comunes:
Si ve errores de codificación, asegúrese de que UTF-8 esté configurado correctamente
Para problemas de permisos en Windows, ejecute como Administrador
Para problemas de ruta de Python, asegúrese de que el entorno virtual esté activado
Depuración:
# Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"
Uso
Línea de comandos
Convertir página web a Markdown:
Convertir archivo local:
Integración de aplicaciones de escritorio
Para integrar este servidor con una aplicación de escritorio, agregue lo siguiente a la configuración del servidor de su aplicación:
Solución de problemas
Problemas de codificación
Si encuentra problemas de codificación de caracteres, asegúrese de que la variable de entorno
PYTHONIOENCODINGesté configurada enutf-8Es posible que los usuarios de Windows deban ejecutar
chcp 65001para habilitar la compatibilidad con UTF-8
Problemas de permisos
Asegúrese de tener suficientes permisos de lectura y escritura de archivos
En Windows, es posible que deba ejecutarlo como administrador
Expresiones de gratitud
Este proyecto se basa en la obra original de Zach Cáceres. Agradecemos al autor original su excelente contribución.
Licencia
Este proyecto sigue bajo la licencia MIT. Consulte el archivo de licencia para más detalles.
Contribuyendo
¡Agradecemos sus contribuciones! Antes de enviar una solicitud de incorporación de cambios, por favor:
Asegúrese de que su código siga los estándares de codificación del proyecto
Agregue pruebas y documentación necesarias
Actualizar las secciones relevantes en el README
Contacto
Para problemas o sugerencias:
Enviar un problema: https://github.com/JDJR2024/markdownify-mcp-utf8/issues
Crear una solicitud de extracción: https://github.com/JDJR2024/markdownify-mcp-utf8/pulls
Correo electrónico: jdidndosmmxmx@gmail.com
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
Un servidor de conversión de documentos que transforma varios formatos de archivos (PDF, documentos, imágenes, audio, contenido web) a Markdown con soporte multilingüe y UTF-8 mejorado.
- Mejoras
- Diferencias clave con el proyecto original
- Características
- Inicio rápido
- Requisitos
- Guía de instalación detallada
- Guía de uso
- Uso
- Solución de problemas
- Expresiones de gratitud
- Licencia
- Contribuyendo
- Contacto
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1072,163MIT License
Skrape MCP Serverofficial
Asecurity-licenseAqualityThis server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.Last updated -12MIT License- Asecurity-licenseAqualityA server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.Last updated -1434
- -security-license-qualityConverts various file types (documents, images, audio, web content) to markdown format without requiring Docker, supporting PDF, Word, Excel, PowerPoint, images, audio files, web URLs, and more.Last updated -2229