Skip to main content
Glama
JDJR2024

Markdownify MCP Server - UTF-8 Enhanced

by JDJR2024

Markdownify MCP 서버 - UTF-8 향상

이는 원래 Markdownify MCP 프로젝트 의 강화된 버전으로, UTF-8 인코딩 지원이 개선되었고 다국어 콘텐츠 처리가 최적화되었습니다.

중국어판

개선 사항

  • 포괄적인 UTF-8 인코딩 지원이 추가되었습니다.

  • 다국어 콘텐츠의 최적화된 처리

  • Windows 시스템의 인코딩 문제 해결

  • 개선된 오류 처리 메커니즘

Related MCP server: Skrape MCP Server

원본 프로젝트와의 주요 차이점

  1. 향상된 인코딩 지원:

    • 모든 작업에서 전체 UTF-8 지원

    • 중국어, 일본어, 한국어 및 기타 비 ASCII 문자의 적절한 처리

    • Windows 특정 인코딩 문제(cmd.exe 및 PowerShell 호환성)가 해결되었습니다.

  2. 향상된 오류 처리:

    • 영어와 중국어로 된 자세한 오류 메시지

    • 네트워크 문제에 대한 더 나은 예외 처리

    • 변환 실패에 대한 우아한 대체 메커니즘

  3. 확장된 기능:

    • 여러 파일의 일괄 처리에 대한 지원이 추가되었습니다.

    • 향상된 YouTube 비디오 대본 처리

    • 다양한 파일 형식에서 메타데이터 추출 개선

    • 문서 서식의 더 나은 보존

  4. 성능 최적화:

    • 대용량 파일 변환을 위한 최적화된 메모리 사용

    • 다국어 콘텐츠의 더 빠른 처리

    • 종속성 충돌 감소

  5. 더 나은 개발 경험:

    • 포괄적인 디버깅 옵션

    • 세부 로깅 시스템

    • 환경별 구성 지원

    • 영어와 중국어로 명확하게 문서화됨

특징

다양한 파일 유형을 Markdown으로 변환하는 것을 지원합니다.

  • PDF 파일

  • 이미지(메타데이터 포함)

  • 오디오(전사 포함)

  • Word 문서(DOCX)

  • Excel 스프레드시트(XLSX)

  • 파워포인트 프레젠테이션(PPTX)

  • 웹 콘텐츠:

    • YouTube 비디오 대본

    • 검색 결과

    • 일반 웹 페이지

  • 기존 마크다운 파일

빠른 시작

  1. 이 저장소를 복제하세요:

    지엑스피1

  2. 종속성 설치:

    pnpm install

    참고: 이렇게 하면 uv 와 관련 Python 종속성도 설치됩니다.

  3. 프로젝트를 빌드하세요:

    pnpm run build
  4. 서버를 시작합니다:

    pnpm start

요구 사항

  • Node.js 16.0 이상

  • Python 3.8 이상

  • pnpm 패키지 관리자

자세한 설치 가이드

1. 환경 설정

  1. Node.js 설치:

  2. pnpm을 설치하세요:

    npm install -g pnpm
    pnpm --version
  3. Python 설치:

    • Python 공식 웹사이트 에서 다운로드

    • 설치 중에 Python이 PATH에 추가되었는지 확인하세요.

    • 설치 확인: python --version

  4. (Windows 전용) UTF-8 지원 구성:

    # Set system-wide UTF-8
    setx PYTHONIOENCODING UTF-8
    # Set current session UTF-8
    set PYTHONIOENCODING=UTF-8
    # Enable UTF-8 in command prompt
    chcp 65001

2. 프로젝트 설정

  1. 저장소를 복제합니다.

    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git
    cd markdownify-mcp-utf8
  2. Python 가상 환경을 만들고 활성화하세요.

    # Windows
    python -m venv .venv
    .venv\Scripts\activate
    
    # Linux/macOS
    python3 -m venv .venv
    source .venv/bin/activate
  3. 프로젝트 종속성 설치:

    # Install Node.js dependencies
    pnpm install
    
    # Install Python dependencies (will be handled by setup.sh)
    ./setup.sh
  4. 프로젝트를 빌드하세요:

    pnpm run build

3. 검증

  1. 서버를 시작합니다:

    pnpm start
  2. 설치를 테스트하세요:

    # Convert a web page
    python convert_utf8.py "https://example.com"
    
    # Convert a local file
    python convert_utf8.py "path/to/your/file.docx"

사용 가이드

기본 사용법

  1. 웹 페이지 변환:

    python convert_utf8.py "https://example.com"

    변환된 마크다운은 converted_result.md 로 저장됩니다.

  2. 로컬 파일 변환:

    # Convert DOCX
    python convert_utf8.py "document.docx"
    
    # Convert PDF
    python convert_utf8.py "document.pdf"
    
    # Convert PowerPoint
    python convert_utf8.py "presentation.pptx"
    
    # Convert Excel
    python convert_utf8.py "spreadsheet.xlsx"
  3. YouTube 동영상 변환:

    python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"

고급 사용법

  1. 환경 변수:

    # Set custom UV path
    export UV_PATH="/custom/path/to/uv"
    
    # Set custom output directory
    export MARKDOWN_OUTPUT_DIR="/custom/output/path"
  2. 일괄 처리: URL이나 파일 경로를 사용하여 일괄 파일(예: convert_batch.txt )을 만듭니다.

    https://example1.com
    https://example2.com
    file1.docx
    file2.pdf

    그런 다음 실행하세요.

    while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt

문제 해결

  1. 일반적인 문제:

    • 인코딩 오류가 표시되면 UTF-8이 올바르게 설정되었는지 확인하세요.

    • Windows에서 권한 문제가 있는 경우 관리자 권한으로 실행하세요.

    • Python 경로 문제의 경우 가상 환경이 활성화되어 있는지 확인하세요.

  2. 디버깅:

    # Enable debug output
    export DEBUG=true
    python convert_utf8.py "your_file.docx"

용법

명령줄

웹 페이지를 마크다운으로 변환:

python convert_utf8.py "https://example.com"

로컬 파일 변환:

python convert_utf8.py "path/to/your/file.docx"

데스크톱 앱 통합

이 서버를 데스크톱 앱과 통합하려면 앱의 서버 구성에 다음을 추가하세요.

{
  "mcpServers": {
    "markdownify": {
      "command": "node",
      "args": [
        "{ABSOLUTE_PATH}/dist/index.js"
      ],
      "env": {
        "UV_PATH": "/path/to/uv"
      }
    }
  }
}

문제 해결

  1. 인코딩 문제

    • 문자 인코딩 문제가 발생하면 PYTHONIOENCODING 환경 변수가 utf-8 로 설정되어 있는지 확인하세요.

    • Windows 사용자는 UTF-8 지원을 활성화하기 위해 chcp 65001 실행해야 할 수 있습니다.

  2. 권한 문제

    • 충분한 파일 읽기/쓰기 권한이 있는지 확인하세요.

    • Windows에서는 관리자 권한으로 실행해야 할 수도 있습니다.

감사의 말

이 프로젝트는 Zach Caceres의 원작을 기반으로 합니다. 뛰어난 기여를 해주신 원작자께 감사드립니다.

특허

이 프로젝트는 MIT 라이선스에 따라 계속 라이선스가 부여됩니다. 자세한 내용은 라이선스 파일을 참조하세요.

기여하다

기여를 환영합니다! 풀 리퀘스트를 제출하기 전에 다음을 확인해 주세요.

  1. 코드가 프로젝트의 코딩 표준을 따르는지 확인하세요.

  2. 필요한 테스트 및 문서 추가

  3. README의 관련 섹션을 업데이트하세요

연락하다

문제나 제안 사항이 있으시면:

  1. 문제 제출: https://github.com/JDJR2024/markdownify-mcp-utf8/issues

  2. 풀 리퀘스트 만들기: https://github.com/JDJR2024/markdownify-mcp-utf8/pulls

  3. 이메일: jdidndosmmxmx@gmail.com

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/JDJR2024/markdownify-mcp-utf8'

If you have feedback or need assistance with the MCP directory API, please join our Discord server