Markdownify MCP Server - UTF-8 Enhanced
Markdownify MCP サーバー - UTF-8 拡張
これは、UTF-8 エンコードのサポートが改善され、多言語コンテンツの処理が最適化された、オリジナルの Markdownify MCP プロジェクトの拡張バージョンです。
機能強化
包括的なUTF-8エンコードのサポートを追加
多言語コンテンツの最適化された処理
Windowsシステムでのエンコードの問題を修正
エラー処理メカニズムの改善
Related MCP server: Skrape MCP Server
元のプロジェクトとの主な違い
強化されたエンコーディングサポート:
すべての操作で完全な UTF-8 をサポート
中国語、日本語、韓国語、その他の非ASCII文字の適切な処理
Windows 固有のエンコードの問題を修正しました (cmd.exe と PowerShell の互換性)
エラー処理の改善:
英語と中国語の両方で詳細なエラーメッセージ
ネットワークの問題に対する例外処理の改善
変換失敗時の適切なフォールバックメカニズム
拡張機能:
複数ファイルのバッチ処理のサポートを追加
強化された YouTube 動画のトランスクリプト処理
さまざまなファイル形式からのメタデータ抽出の改善
ドキュメントの書式をより適切に保持
パフォーマンスの最適化:
大きなファイルの変換におけるメモリ使用量の最適化
多言語コンテンツの処理の高速化
依存関係の競合の軽減
より良い開発エクスペリエンス:
包括的なデバッグオプション
詳細なログシステム
環境固有の構成サポート
英語と中国語の両方でわかりやすいドキュメント
特徴
さまざまなファイル形式を Markdown に変換することをサポートします。
PDFファイル
画像(メタデータ付き)
音声(書き起こし付き)
Word文書(DOCX)
Excel スプレッドシート (XLSX)
PowerPoint プレゼンテーション (PPTX)
ウェブコンテンツ:
YouTube動画のトランスクリプト
検索結果
一般的なウェブページ
既存のMarkdownファイル
クイックスタート
このリポジトリをクローンします:
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8依存関係をインストールします:
pnpm install注: これにより、
uvおよび関連する Python 依存関係もインストールされます。プロジェクトをビルドします。
pnpm run buildサーバーを起動します。
pnpm start
要件
Node.js 16.0以上
Python 3.8以上
pnpm パッケージマネージャー
ギット
詳細なインストールガイド
1. 環境設定
Node.js をインストールします。
Node.js公式サイトからダウンロード
インストールの確認:
node --version
pnpmをインストールします。
npm install -g pnpm pnpm --versionPython をインストールします。
Python公式サイトからダウンロード
インストール中にPythonがPATHに追加されていることを確認する
インストールの確認:
python --version
(Windows のみ) UTF-8 サポートを構成する:
# Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001
2. プロジェクトのセットアップ
リポジトリをクローンします。
git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8Python 仮想環境を作成してアクティブ化します。
# Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activateプロジェクトの依存関係をインストールします。
# Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.shプロジェクトをビルドします。
pnpm run build
3. 検証
サーバーを起動します。
pnpm startインストールをテストします。
# Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"
使用ガイド
基本的な使い方
Webページの変換:
python convert_utf8.py "https://example.com"変換されたマークダウンは
converted_result.mdとして保存されます。ローカルファイルの変換:
# Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"YouTube 動画の変換:
python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"
高度な使用法
環境変数:
# Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"バッチ処理: URL またはファイル パスを含むバッチ ファイル (例:
convert_batch.txt) を作成します。https://example1.com https://example2.com file1.docx file2.pdf次に以下を実行します:
while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt
トラブルシューティング
よくある問題:
エンコードエラーが表示される場合は、UTF-8が正しく設定されていることを確認してください。
Windowsの権限の問題の場合は、管理者として実行してください
Pythonパスの問題の場合は、仮想環境がアクティブになっていることを確認してください
デバッグ:
# Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"
使用法
コマンドライン
WebページをMarkdownに変換する:
python convert_utf8.py "https://example.com"ローカルファイルを変換:
python convert_utf8.py "path/to/your/file.docx"デスクトップアプリの統合
このサーバーをデスクトップ アプリと統合するには、アプリのサーバー構成に以下を追加します。
{
"mcpServers": {
"markdownify": {
"command": "node",
"args": [
"{ABSOLUTE_PATH}/dist/index.js"
],
"env": {
"UV_PATH": "/path/to/uv"
}
}
}
}トラブルシューティング
エンコーディングの問題
文字エンコードの問題が発生した場合は、
PYTHONIOENCODING環境変数がutf-8に設定されていることを確認してください。Windowsユーザーは、UTF-8サポートを有効にするために
chcp 65001実行する必要があるかもしれません。
権限の問題
十分なファイルの読み取り/書き込み権限があることを確認してください
Windowsでは管理者として実行する必要があるかもしれません
謝辞
このプロジェクトは、Zach Caceres 氏のオリジナル作品に基づいています。素晴らしい貢献をしてくださった原作者に感謝申し上げます。
ライセンス
このプロジェクトは引き続きMITライセンスの下でライセンスされます。詳細はLICENSEファイルをご覧ください。
貢献
貢献を歓迎します!プルリクエストを送信する前に、以下の点にご注意ください。
コードがプロジェクトのコーディング標準に準拠していることを確認する
必要なテストとドキュメントを追加する
READMEの関連セクションを更新する
接触
問題や提案については:
Maintenance
Resources
Unclaimed servers have limited discoverability.
Looking for Admin?
If you are the server author, to access and configure the admin panel.
Latest Blog Posts
MCP directory API
We provide all the information about MCP servers via our MCP API.
curl -X GET 'https://glama.ai/api/mcp/v1/servers/JDJR2024/markdownify-mcp-utf8'
If you have feedback or need assistance with the MCP directory API, please join our Discord server