Markdownify MCP Server - UTF-8 Enhanced

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Provides comprehensive conversion of various file formats to Markdown, preserving formatting and structure in the conversion process

  • Converts YouTube videos to Markdown format, including extraction of video transcripts when available

Markdownify MCP 서버 - UTF-8 향상

이는 원래 Markdownify MCP 프로젝트 의 강화된 버전으로, UTF-8 인코딩 지원이 개선되었고 다국어 콘텐츠 처리가 최적화되었습니다.

중국어판

개선 사항

  • 포괄적인 UTF-8 인코딩 지원이 추가되었습니다.
  • 다국어 콘텐츠의 최적화된 처리
  • Windows 시스템의 인코딩 문제 해결
  • 개선된 오류 처리 메커니즘

원본 프로젝트와의 주요 차이점

  1. 향상된 인코딩 지원:
    • 모든 작업에서 전체 UTF-8 지원
    • 중국어, 일본어, 한국어 및 기타 비 ASCII 문자의 적절한 처리
    • Windows 특정 인코딩 문제(cmd.exe 및 PowerShell 호환성)가 해결되었습니다.
  2. 향상된 오류 처리:
    • 영어와 중국어로 된 자세한 오류 메시지
    • 네트워크 문제에 대한 더 나은 예외 처리
    • 변환 실패에 대한 우아한 대체 메커니즘
  3. 확장된 기능:
    • 여러 파일의 일괄 처리에 대한 지원이 추가되었습니다.
    • 향상된 YouTube 비디오 대본 처리
    • 다양한 파일 형식에서 메타데이터 추출 개선
    • 문서 서식의 더 나은 보존
  4. 성능 최적화:
    • 대용량 파일 변환을 위한 최적화된 메모리 사용
    • 다국어 콘텐츠의 더 빠른 처리
    • 종속성 충돌 감소
  5. 더 나은 개발 경험:
    • 포괄적인 디버깅 옵션
    • 세부 로깅 시스템
    • 환경별 구성 지원
    • 영어와 중국어로 명확하게 문서화됨

특징

다양한 파일 유형을 Markdown으로 변환하는 것을 지원합니다.

  • PDF 파일
  • 이미지(메타데이터 포함)
  • 오디오(전사 포함)
  • Word 문서(DOCX)
  • Excel 스프레드시트(XLSX)
  • 파워포인트 프레젠테이션(PPTX)
  • 웹 콘텐츠:
    • YouTube 비디오 대본
    • 검색 결과
    • 일반 웹 페이지
  • 기존 마크다운 파일

빠른 시작

  1. 이 저장소를 복제하세요:지엑스피1
  2. 종속성 설치:
    pnpm install
    참고: 이렇게 하면 uv 와 관련 Python 종속성도 설치됩니다.
  3. 프로젝트를 빌드하세요:
    pnpm run build
  4. 서버를 시작합니다:
    pnpm start

요구 사항

  • Node.js 16.0 이상
  • Python 3.8 이상
  • pnpm 패키지 관리자

자세한 설치 가이드

1. 환경 설정

  1. Node.js 설치:
  2. pnpm을 설치하세요:
    npm install -g pnpm pnpm --version
  3. Python 설치:
    • Python 공식 웹사이트 에서 다운로드
    • 설치 중에 Python이 PATH에 추가되었는지 확인하세요.
    • 설치 확인: python --version
  4. (Windows 전용) UTF-8 지원 구성:
    # Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001

2. 프로젝트 설정

  1. 저장소를 복제합니다.
    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8
  2. Python 가상 환경을 만들고 활성화하세요.
    # Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activate
  3. 프로젝트 종속성 설치:
    # Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.sh
  4. 프로젝트를 빌드하세요:
    pnpm run build

3. 검증

  1. 서버를 시작합니다:
    pnpm start
  2. 설치를 테스트하세요:
    # Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"

사용 가이드

기본 사용법

  1. 웹 페이지 변환:
    python convert_utf8.py "https://example.com"
    변환된 마크다운은 converted_result.md 로 저장됩니다.
  2. 로컬 파일 변환:
    # Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"
  3. YouTube 동영상 변환:
    python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"

고급 사용법

  1. 환경 변수:
    # Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"
  2. 일괄 처리: URL이나 파일 경로를 사용하여 일괄 파일(예: convert_batch.txt )을 만듭니다.
    https://example1.com https://example2.com file1.docx file2.pdf
    그런 다음 실행하세요.
    while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt

문제 해결

  1. 일반적인 문제:
    • 인코딩 오류가 표시되면 UTF-8이 올바르게 설정되었는지 확인하세요.
    • Windows에서 권한 문제가 있는 경우 관리자 권한으로 실행하세요.
    • Python 경로 문제의 경우 가상 환경이 활성화되어 있는지 확인하세요.
  2. 디버깅:
    # Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"

용법

명령줄

웹 페이지를 마크다운으로 변환:

python convert_utf8.py "https://example.com"

로컬 파일 변환:

python convert_utf8.py "path/to/your/file.docx"

데스크톱 앱 통합

이 서버를 데스크톱 앱과 통합하려면 앱의 서버 구성에 다음을 추가하세요.

{ "mcpServers": { "markdownify": { "command": "node", "args": [ "{ABSOLUTE_PATH}/dist/index.js" ], "env": { "UV_PATH": "/path/to/uv" } } } }

문제 해결

  1. 인코딩 문제
    • 문자 인코딩 문제가 발생하면 PYTHONIOENCODING 환경 변수가 utf-8 로 설정되어 있는지 확인하세요.
    • Windows 사용자는 UTF-8 지원을 활성화하기 위해 chcp 65001 실행해야 할 수 있습니다.
  2. 권한 문제
    • 충분한 파일 읽기/쓰기 권한이 있는지 확인하세요.
    • Windows에서는 관리자 권한으로 실행해야 할 수도 있습니다.

감사의 말

이 프로젝트는 Zach Caceres의 원작을 기반으로 합니다. 뛰어난 기여를 해주신 원작자께 감사드립니다.

특허

이 프로젝트는 MIT 라이선스에 따라 계속 라이선스가 부여됩니다. 자세한 내용은 라이선스 파일을 참조하세요.

기여하다

기여를 환영합니다! 풀 리퀘스트를 제출하기 전에 다음을 확인해 주세요.

  1. 코드가 프로젝트의 코딩 표준을 따르는지 확인하세요.
  2. 필요한 테스트 및 문서 추가
  3. README의 관련 섹션을 업데이트하세요

연락하다

문제나 제안 사항이 있으시면:

  1. 문제 제출: https://github.com/JDJR2024/markdownify-mcp-utf8/issues
  2. 풀 리퀘스트 만들기: https://github.com/JDJR2024/markdownify-mcp-utf8/pulls
  3. 이메일: jdidndosmmxmx@gmail.com
ID: 51hyoj300s