Markdownify MCP 서버 - UTF-8 향상
이는 원래 Markdownify MCP 프로젝트 의 강화된 버전으로, UTF-8 인코딩 지원이 개선되었고 다국어 콘텐츠 처리가 최적화되었습니다.
개선 사항
포괄적인 UTF-8 인코딩 지원이 추가되었습니다.
다국어 콘텐츠의 최적화된 처리
Windows 시스템의 인코딩 문제 해결
개선된 오류 처리 메커니즘
원본 프로젝트와의 주요 차이점
향상된 인코딩 지원:
모든 작업에서 전체 UTF-8 지원
중국어, 일본어, 한국어 및 기타 비 ASCII 문자의 적절한 처리
Windows 특정 인코딩 문제(cmd.exe 및 PowerShell 호환성)가 해결되었습니다.
향상된 오류 처리:
영어와 중국어로 된 자세한 오류 메시지
네트워크 문제에 대한 더 나은 예외 처리
변환 실패에 대한 우아한 대체 메커니즘
확장된 기능:
여러 파일의 일괄 처리에 대한 지원이 추가되었습니다.
향상된 YouTube 비디오 대본 처리
다양한 파일 형식에서 메타데이터 추출 개선
문서 서식의 더 나은 보존
성능 최적화:
대용량 파일 변환을 위한 최적화된 메모리 사용
다국어 콘텐츠의 더 빠른 처리
종속성 충돌 감소
더 나은 개발 경험:
포괄적인 디버깅 옵션
세부 로깅 시스템
환경별 구성 지원
영어와 중국어로 명확하게 문서화됨
특징
다양한 파일 유형을 Markdown으로 변환하는 것을 지원합니다.
PDF 파일
이미지(메타데이터 포함)
오디오(전사 포함)
Word 문서(DOCX)
Excel 스프레드시트(XLSX)
파워포인트 프레젠테이션(PPTX)
웹 콘텐츠:
YouTube 비디오 대본
검색 결과
일반 웹 페이지
기존 마크다운 파일
빠른 시작
이 저장소를 복제하세요:
지엑스피1
종속성 설치:
pnpm install참고: 이렇게 하면
uv와 관련 Python 종속성도 설치됩니다.프로젝트를 빌드하세요:
pnpm run build서버를 시작합니다:
pnpm start
요구 사항
Node.js 16.0 이상
Python 3.8 이상
pnpm 패키지 관리자
깃
자세한 설치 가이드
1. 환경 설정
Node.js 설치:
Node.js 공식 웹사이트 에서 다운로드
설치 확인:
node --version
pnpm을 설치하세요:
npm install -g pnpm pnpm --versionPython 설치:
Python 공식 웹사이트 에서 다운로드
설치 중에 Python이 PATH에 추가되었는지 확인하세요.
설치 확인:
python --version
(Windows 전용) UTF-8 지원 구성:
# Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001
2. 프로젝트 설정
저장소를 복제합니다.
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8Python 가상 환경을 만들고 활성화하세요.
# Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activate프로젝트 종속성 설치:
# Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.sh프로젝트를 빌드하세요:
pnpm run build
3. 검증
서버를 시작합니다:
pnpm start설치를 테스트하세요:
# Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"
사용 가이드
기본 사용법
웹 페이지 변환:
python convert_utf8.py "https://example.com"변환된 마크다운은
converted_result.md로 저장됩니다.로컬 파일 변환:
# Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"YouTube 동영상 변환:
python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"
고급 사용법
환경 변수:
# Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"일괄 처리: URL이나 파일 경로를 사용하여 일괄 파일(예:
convert_batch.txt)을 만듭니다.https://example1.com https://example2.com file1.docx file2.pdf그런 다음 실행하세요.
while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt
문제 해결
일반적인 문제:
인코딩 오류가 표시되면 UTF-8이 올바르게 설정되었는지 확인하세요.
Windows에서 권한 문제가 있는 경우 관리자 권한으로 실행하세요.
Python 경로 문제의 경우 가상 환경이 활성화되어 있는지 확인하세요.
디버깅:
# Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"
용법
명령줄
웹 페이지를 마크다운으로 변환:
로컬 파일 변환:
데스크톱 앱 통합
이 서버를 데스크톱 앱과 통합하려면 앱의 서버 구성에 다음을 추가하세요.
문제 해결
인코딩 문제
문자 인코딩 문제가 발생하면
PYTHONIOENCODING환경 변수가utf-8로 설정되어 있는지 확인하세요.Windows 사용자는 UTF-8 지원을 활성화하기 위해
chcp 65001실행해야 할 수 있습니다.
권한 문제
충분한 파일 읽기/쓰기 권한이 있는지 확인하세요.
Windows에서는 관리자 권한으로 실행해야 할 수도 있습니다.
감사의 말
이 프로젝트는 Zach Caceres의 원작을 기반으로 합니다. 뛰어난 기여를 해주신 원작자께 감사드립니다.
특허
이 프로젝트는 MIT 라이선스에 따라 계속 라이선스가 부여됩니다. 자세한 내용은 라이선스 파일을 참조하세요.
기여하다
기여를 환영합니다! 풀 리퀘스트를 제출하기 전에 다음을 확인해 주세요.
코드가 프로젝트의 코딩 표준을 따르는지 확인하세요.
필요한 테스트 및 문서 추가
README의 관련 섹션을 업데이트하세요
연락하다
문제나 제안 사항이 있으시면:
Related MCP Servers
- Asecurity-licenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1072,163MIT License
Skrape MCP Serverofficial
Asecurity-licenseAqualityThis server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.Last updated -12MIT License- Asecurity-licenseAqualityA server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.Last updated -1434
- -security-license-qualityConverts various file types (documents, images, audio, web content) to markdown format without requiring Docker, supporting PDF, Word, Excel, PowerPoint, images, audio files, web URLs, and more.Last updated -2229