Markdownify MCP サーバー - UTF-8 拡張
これは、UTF-8 エンコードのサポートが改善され、多言語コンテンツの処理が最適化された、オリジナルの Markdownify MCP プロジェクトの拡張バージョンです。
機能強化
- 包括的なUTF-8エンコードのサポートを追加
- 多言語コンテンツの最適化された処理
- Windowsシステムでのエンコードの問題を修正
- エラー処理メカニズムの改善
元のプロジェクトとの主な違い
- 強化されたエンコーディングサポート:
- すべての操作で完全な UTF-8 をサポート
- 中国語、日本語、韓国語、その他の非ASCII文字の適切な処理
- Windows 固有のエンコードの問題を修正しました (cmd.exe と PowerShell の互換性)
- エラー処理の改善:
- 英語と中国語の両方で詳細なエラーメッセージ
- ネットワークの問題に対する例外処理の改善
- 変換失敗時の適切なフォールバックメカニズム
- 拡張機能:
- 複数ファイルのバッチ処理のサポートを追加
- 強化された YouTube 動画のトランスクリプト処理
- さまざまなファイル形式からのメタデータ抽出の改善
- ドキュメントの書式をより適切に保持
- パフォーマンスの最適化:
- 大きなファイルの変換におけるメモリ使用量の最適化
- 多言語コンテンツの処理の高速化
- 依存関係の競合の軽減
- より良い開発エクスペリエンス:
- 包括的なデバッグオプション
- 詳細なログシステム
- 環境固有の構成サポート
- 英語と中国語の両方でわかりやすいドキュメント
特徴
さまざまなファイル形式を Markdown に変換することをサポートします。
- PDFファイル
- 画像(メタデータ付き)
- 音声(書き起こし付き)
- Word文書(DOCX)
- Excel スプレッドシート (XLSX)
- PowerPoint プレゼンテーション (PPTX)
- ウェブコンテンツ:
- YouTube動画のトランスクリプト
- 検索結果
- 一般的なウェブページ
- 既存のMarkdownファイル
クイックスタート
- このリポジトリをクローンします:
- 依存関係をインストールします:注: これにより、
uv
および関連する Python 依存関係もインストールされます。 - プロジェクトをビルドします。
- サーバーを起動します。
要件
- Node.js 16.0以上
- Python 3.8以上
- pnpm パッケージマネージャー
- ギット
詳細なインストールガイド
1. 環境設定
- Node.js をインストールします。
- Node.js公式サイトからダウンロード
- インストールの確認:
node --version
- pnpmをインストールします。
- Python をインストールします。
- Python公式サイトからダウンロード
- インストール中にPythonがPATHに追加されていることを確認する
- インストールの確認:
python --version
- (Windows のみ) UTF-8 サポートを構成する:
2. プロジェクトのセットアップ
- リポジトリをクローンします。
- Python 仮想環境を作成してアクティブ化します。
- プロジェクトの依存関係をインストールします。
- プロジェクトをビルドします。
3. 検証
- サーバーを起動します。
- インストールをテストします。
使用ガイド
基本的な使い方
- Webページの変換:変換されたマークダウンは
converted_result.md
として保存されます。 - ローカルファイルの変換:
- YouTube 動画の変換:
高度な使用法
- 環境変数:
- バッチ処理: URL またはファイル パスを含むバッチ ファイル (例:
convert_batch.txt
) を作成します。次に以下を実行します:
トラブルシューティング
- よくある問題:
- エンコードエラーが表示される場合は、UTF-8が正しく設定されていることを確認してください。
- Windowsの権限の問題の場合は、管理者として実行してください
- Pythonパスの問題の場合は、仮想環境がアクティブになっていることを確認してください
- デバッグ:
使用法
コマンドライン
WebページをMarkdownに変換する:
ローカルファイルを変換:
デスクトップアプリの統合
このサーバーをデスクトップ アプリと統合するには、アプリのサーバー構成に以下を追加します。
トラブルシューティング
- エンコーディングの問題
- 文字エンコードの問題が発生した場合は、
PYTHONIOENCODING
環境変数がutf-8
に設定されていることを確認してください。 - Windowsユーザーは、UTF-8サポートを有効にするために
chcp 65001
実行する必要があるかもしれません。
- 文字エンコードの問題が発生した場合は、
- 権限の問題
- 十分なファイルの読み取り/書き込み権限があることを確認してください
- Windowsでは管理者として実行する必要があるかもしれません
謝辞
このプロジェクトは、Zach Caceres 氏のオリジナル作品に基づいています。素晴らしい貢献をしてくださった原作者に感謝申し上げます。
ライセンス
このプロジェクトは引き続きMITライセンスの下でライセンスされます。詳細はLICENSEファイルをご覧ください。
貢献
貢献を歓迎します!プルリクエストを送信する前に、以下の点にご注意ください。
- コードがプロジェクトのコーディング標準に準拠していることを確認する
- 必要なテストとドキュメントを追加する
- READMEの関連セクションを更新する
接触
問題や提案については:
You must be authenticated.
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
Tools
多言語および UTF-8 サポートが強化された、さまざまなファイル形式 (PDF、ドキュメント、画像、オーディオ、Web コンテンツ) を Markdown に変換するドキュメント変換サーバーです。
Related Resources
Related MCP Servers
- AsecurityFlicenseAqualityAn MCP server for converting Markdown documents to PDF files.Last updated -11JavaScript
- AsecurityAlicenseAqualityConverts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.Last updated -1021,611TypeScriptMIT License
Skrape MCP Serverofficial
AsecurityAlicenseAqualityThis server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.Last updated -15JavaScriptMIT License- AsecurityAlicenseAqualityConverts various file formats to Markdown using the MarkItDown utility and can be integrated with MCP clients for seamless document processing and conversion.Last updated -26PythonMIT License