Skip to main content
Glama
JDJR2024

Markdownify MCP Server - UTF-8 Enhanced

by JDJR2024

Markdownify MCP サーバー - UTF-8 拡張

これは、UTF-8 エンコードのサポートが改善され、多言語コンテンツの処理が最適化された、オリジナルの Markdownify MCP プロジェクトの拡張バージョンです。

中国語の文書

機能強化

  • 包括的なUTF-8エンコードのサポートを追加

  • 多言語コンテンツの最適化された処理

  • Windowsシステムでのエンコードの問題を修正

  • エラー処理メカニズムの改善

Related MCP server: Skrape MCP Server

元のプロジェクトとの主な違い

  1. 強化されたエンコーディングサポート:

    • すべての操作で完全な UTF-8 をサポート

    • 中国語、日本語、韓国語、その他の非ASCII文字の適切な処理

    • Windows 固有のエンコードの問題を修正しました (cmd.exe と PowerShell の互換性)

  2. エラー処理の改善:

    • 英語と中国語の両方で詳細なエラーメッセージ

    • ネットワークの問題に対する例外処理の改善

    • 変換失敗時の適切なフォールバックメカニズム

  3. 拡張機能:

    • 複数ファイルのバッチ処理のサポートを追加

    • 強化された YouTube 動画のトランスクリプト処理

    • さまざまなファイル形式からのメタデータ抽出の改善

    • ドキュメントの書式をより適切に保持

  4. パフォーマンスの最適化:

    • 大きなファイルの変換におけるメモリ使用量の最適化

    • 多言語コンテンツの処理の高速化

    • 依存関係の競合の軽減

  5. より良い開発エクスペリエンス:

    • 包括的なデバッグオプション

    • 詳細なログシステム

    • 環境固有の構成サポート

    • 英語と中国語の両方でわかりやすいドキュメント

特徴

さまざまなファイル形式を Markdown に変換することをサポートします。

  • PDFファイル

  • 画像(メタデータ付き)

  • 音声(書き起こし付き)

  • Word文書(DOCX)

  • Excel スプレッドシート (XLSX)

  • PowerPoint プレゼンテーション (PPTX)

  • ウェブコンテンツ:

    • YouTube動画のトランスクリプト

    • 検索結果

    • 一般的なウェブページ

  • 既存のMarkdownファイル

クイックスタート

  1. このリポジトリをクローンします:

    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8
  2. 依存関係をインストールします:

    pnpm install

    注: これにより、 uvおよび関連する Python 依存関係もインストールされます。

  3. プロジェクトをビルドします。

    pnpm run build
  4. サーバーを起動します。

    pnpm start

要件

  • Node.js 16.0以上

  • Python 3.8以上

  • pnpm パッケージマネージャー

  • ギット

詳細なインストールガイド

1. 環境設定

  1. Node.js をインストールします。

  2. pnpmをインストールします。

    npm install -g pnpm pnpm --version
  3. Python をインストールします。

    • Python公式サイトからダウンロード

    • インストール中にPythonがPATHに追加されていることを確認する

    • インストールの確認: python --version

  4. (Windows のみ) UTF-8 サポートを構成する:

    # Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001

2. プロジェクトのセットアップ

  1. リポジトリをクローンします。

    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8
  2. Python 仮想環境を作成してアクティブ化します。

    # Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activate
  3. プロジェクトの依存関係をインストールします。

    # Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.sh
  4. プロジェクトをビルドします。

    pnpm run build

3. 検証

  1. サーバーを起動します。

    pnpm start
  2. インストールをテストします。

    # Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"

使用ガイド

基本的な使い方

  1. Webページの変換:

    python convert_utf8.py "https://example.com"

    変換されたマークダウンはconverted_result.mdとして保存されます。

  2. ローカルファイルの変換:

    # Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"
  3. YouTube 動画の変換:

    python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"

高度な使用法

  1. 環境変数:

    # Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"
  2. バッチ処理: URL またはファイル パスを含むバッチ ファイル (例: convert_batch.txt ) を作成します。

    https://example1.com https://example2.com file1.docx file2.pdf

    次に以下を実行します:

    while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt

トラブルシューティング

  1. よくある問題:

    • エンコードエラーが表示される場合は、UTF-8が正しく設定されていることを確認してください。

    • Windowsの権限の問題の場合は、管理者として実行してください

    • Pythonパスの問題の場合は、仮想環境がアクティブになっていることを確認してください

  2. デバッグ:

    # Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"

使用法

コマンドライン

WebページをMarkdownに変換する:

python convert_utf8.py "https://example.com"

ローカルファイルを変換:

python convert_utf8.py "path/to/your/file.docx"

デスクトップアプリの統合

このサーバーをデスクトップ アプリと統合するには、アプリのサーバー構成に以下を追加します。

{ "mcpServers": { "markdownify": { "command": "node", "args": [ "{ABSOLUTE_PATH}/dist/index.js" ], "env": { "UV_PATH": "/path/to/uv" } } } }

トラブルシューティング

  1. エンコーディングの問題

    • 文字エンコードの問題が発生した場合は、 PYTHONIOENCODING環境変数がutf-8に設定されていることを確認してください。

    • Windowsユーザーは、UTF-8サポートを有効にするためにchcp 65001実行する必要があるかもしれません。

  2. 権限の問題

    • 十分なファイルの読み取り/書き込み権限があることを確認してください

    • Windowsでは管理者として実行する必要があるかもしれません

謝辞

このプロジェクトは、Zach Caceres 氏のオリジナル作品に基づいています。素晴らしい貢献をしてくださった原作者に感謝申し上げます。

ライセンス

このプロジェクトは引き続きMITライセンスの下でライセンスされます。詳細はLICENSEファイルをご覧ください。

貢献

貢献を歓迎します!プルリクエストを送信する前に、以下の点にご注意ください。

  1. コードがプロジェクトのコーディング標準に準拠していることを確認する

  2. 必要なテストとドキュメントを追加する

  3. READMEの関連セクションを更新する

接触

問題や提案については:

  1. 問題を提出する: https://github.com/JDJR2024/markdownify-mcp-utf8/issues

  2. プルリクエストを作成: https://github.com/JDJR2024/markdownify-mcp-utf8/pulls

  3. メールアドレス: jdidndosmmxmx@gmail.com

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/JDJR2024/markdownify-mcp-utf8'

If you have feedback or need assistance with the MCP directory API, please join our Discord server