Markdownify MCP サーバー - UTF-8 拡張
これは、UTF-8 エンコードのサポートが改善され、多言語コンテンツの処理が最適化された、オリジナルの Markdownify MCP プロジェクトの拡張バージョンです。
機能強化
包括的なUTF-8エンコードのサポートを追加
多言語コンテンツの最適化された処理
Windowsシステムでのエンコードの問題を修正
エラー処理メカニズムの改善
元のプロジェクトとの主な違い
強化されたエンコーディングサポート:
すべての操作で完全な UTF-8 をサポート
中国語、日本語、韓国語、その他の非ASCII文字の適切な処理
Windows 固有のエンコードの問題を修正しました (cmd.exe と PowerShell の互換性)
エラー処理の改善:
英語と中国語の両方で詳細なエラーメッセージ
ネットワークの問題に対する例外処理の改善
変換失敗時の適切なフォールバックメカニズム
拡張機能:
複数ファイルのバッチ処理のサポートを追加
強化された YouTube 動画のトランスクリプト処理
さまざまなファイル形式からのメタデータ抽出の改善
ドキュメントの書式をより適切に保持
パフォーマンスの最適化:
大きなファイルの変換におけるメモリ使用量の最適化
多言語コンテンツの処理の高速化
依存関係の競合の軽減
より良い開発エクスペリエンス:
包括的なデバッグオプション
詳細なログシステム
環境固有の構成サポート
英語と中国語の両方でわかりやすいドキュメント
特徴
さまざまなファイル形式を Markdown に変換することをサポートします。
PDFファイル
画像(メタデータ付き)
音声(書き起こし付き)
Word文書(DOCX)
Excel スプレッドシート (XLSX)
PowerPoint プレゼンテーション (PPTX)
ウェブコンテンツ:
YouTube動画のトランスクリプト
検索結果
一般的なウェブページ
既存のMarkdownファイル
クイックスタート
このリポジトリをクローンします:
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8依存関係をインストールします:
pnpm install注: これにより、
uvおよび関連する Python 依存関係もインストールされます。プロジェクトをビルドします。
pnpm run buildサーバーを起動します。
pnpm start
要件
Node.js 16.0以上
Python 3.8以上
pnpm パッケージマネージャー
ギット
詳細なインストールガイド
1. 環境設定
Node.js をインストールします。
Node.js公式サイトからダウンロード
インストールの確認:
node --version
pnpmをインストールします。
npm install -g pnpm pnpm --versionPython をインストールします。
Python公式サイトからダウンロード
インストール中にPythonがPATHに追加されていることを確認する
インストールの確認:
python --version
(Windows のみ) UTF-8 サポートを構成する:
# Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001
2. プロジェクトのセットアップ
リポジトリをクローンします。
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8Python 仮想環境を作成してアクティブ化します。
# Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activateプロジェクトの依存関係をインストールします。
# Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.shプロジェクトをビルドします。
pnpm run build
3. 検証
サーバーを起動します。
pnpm startインストールをテストします。
# Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"
使用ガイド
基本的な使い方
Webページの変換:
python convert_utf8.py "https://example.com"変換されたマークダウンは
converted_result.mdとして保存されます。ローカルファイルの変換:
# Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"YouTube 動画の変換:
python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"
高度な使用法
環境変数:
# Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"バッチ処理: URL またはファイル パスを含むバッチ ファイル (例:
convert_batch.txt) を作成します。https://example1.com https://example2.com file1.docx file2.pdf次に以下を実行します:
while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt
トラブルシューティング
よくある問題:
エンコードエラーが表示される場合は、UTF-8が正しく設定されていることを確認してください。
Windowsの権限の問題の場合は、管理者として実行してください
Pythonパスの問題の場合は、仮想環境がアクティブになっていることを確認してください
デバッグ:
# Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"
使用法
コマンドライン
WebページをMarkdownに変換する:
ローカルファイルを変換:
デスクトップアプリの統合
このサーバーをデスクトップ アプリと統合するには、アプリのサーバー構成に以下を追加します。
トラブルシューティング
エンコーディングの問題
文字エンコードの問題が発生した場合は、
PYTHONIOENCODING環境変数がutf-8に設定されていることを確認してください。Windowsユーザーは、UTF-8サポートを有効にするために
chcp 65001実行する必要があるかもしれません。
権限の問題
十分なファイルの読み取り/書き込み権限があることを確認してください
Windowsでは管理者として実行する必要があるかもしれません
謝辞
このプロジェクトは、Zach Caceres 氏のオリジナル作品に基づいています。素晴らしい貢献をしてくださった原作者に感謝申し上げます。
ライセンス
このプロジェクトは引き続きMITライセンスの下でライセンスされます。詳細はLICENSEファイルをご覧ください。
貢献
貢献を歓迎します!プルリクエストを送信する前に、以下の点にご注意ください。
コードがプロジェクトのコーディング標準に準拠していることを確認する
必要なテストとドキュメントを追加する
READMEの関連セクションを更新する
接触
問題や提案については:
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
多言語および UTF-8 サポートが強化された、さまざまなファイル形式 (PDF、ドキュメント、画像、オーディオ、Web コンテンツ) を Markdown に変換するドキュメント変換サーバーです。
Related Resources
Related MCP Servers
- Asecurity-licenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1072,163MIT License
Skrape MCP Serverofficial
Asecurity-licenseAqualityThis server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.Last updated -12MIT License- Asecurity-licenseAqualityA server that converts various file formats (PDF, images, Office documents, etc.) to Markdown descriptions using Cloudflare AI services.Last updated -1434
- -security-license-qualityConverts various file types (documents, images, audio, web content) to markdown format without requiring Docker, supporting PDF, Word, Excel, PowerPoint, images, audio files, web URLs, and more.Last updated -2229