Skip to main content
Glama
JDJR2024

Markdownify MCP Server - UTF-8 Enhanced

by JDJR2024

Markdownify MCP サーバー - UTF-8 拡張

これは、UTF-8 エンコードのサポートが改善され、多言語コンテンツの処理が最適化された、オリジナルの Markdownify MCP プロジェクトの拡張バージョンです。

中国語の文書

機能強化

  • 包括的なUTF-8エンコードのサポートを追加

  • 多言語コンテンツの最適化された処理

  • Windowsシステムでのエンコードの問題を修正

  • エラー処理メカニズムの改善

Related MCP server: Skrape MCP Server

元のプロジェクトとの主な違い

  1. 強化されたエンコーディングサポート:

    • すべての操作で完全な UTF-8 をサポート

    • 中国語、日本語、韓国語、その他の非ASCII文字の適切な処理

    • Windows 固有のエンコードの問題を修正しました (cmd.exe と PowerShell の互換性)

  2. エラー処理の改善:

    • 英語と中国語の両方で詳細なエラーメッセージ

    • ネットワークの問題に対する例外処理の改善

    • 変換失敗時の適切なフォールバックメカニズム

  3. 拡張機能:

    • 複数ファイルのバッチ処理のサポートを追加

    • 強化された YouTube 動画のトランスクリプト処理

    • さまざまなファイル形式からのメタデータ抽出の改善

    • ドキュメントの書式をより適切に保持

  4. パフォーマンスの最適化:

    • 大きなファイルの変換におけるメモリ使用量の最適化

    • 多言語コンテンツの処理の高速化

    • 依存関係の競合の軽減

  5. より良い開発エクスペリエンス:

    • 包括的なデバッグオプション

    • 詳細なログシステム

    • 環境固有の構成サポート

    • 英語と中国語の両方でわかりやすいドキュメント

特徴

さまざまなファイル形式を Markdown に変換することをサポートします。

  • PDFファイル

  • 画像(メタデータ付き)

  • 音声(書き起こし付き)

  • Word文書(DOCX)

  • Excel スプレッドシート (XLSX)

  • PowerPoint プレゼンテーション (PPTX)

  • ウェブコンテンツ:

    • YouTube動画のトランスクリプト

    • 検索結果

    • 一般的なウェブページ

  • 既存のMarkdownファイル

クイックスタート

  1. このリポジトリをクローンします:

    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git
    cd markdownify-mcp-utf8
  2. 依存関係をインストールします:

    pnpm install

    注: これにより、 uvおよび関連する Python 依存関係もインストールされます。

  3. プロジェクトをビルドします。

    pnpm run build
  4. サーバーを起動します。

    pnpm start

要件

  • Node.js 16.0以上

  • Python 3.8以上

  • pnpm パッケージマネージャー

  • ギット

詳細なインストールガイド

1. 環境設定

  1. Node.js をインストールします。

  2. pnpmをインストールします。

    npm install -g pnpm
    pnpm --version
  3. Python をインストールします。

    • Python公式サイトからダウンロード

    • インストール中にPythonがPATHに追加されていることを確認する

    • インストールの確認: python --version

  4. (Windows のみ) UTF-8 サポートを構成する:

    # Set system-wide UTF-8
    setx PYTHONIOENCODING UTF-8
    # Set current session UTF-8
    set PYTHONIOENCODING=UTF-8
    # Enable UTF-8 in command prompt
    chcp 65001

2. プロジェクトのセットアップ

  1. リポジトリをクローンします。

    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git
    cd markdownify-mcp-utf8
  2. Python 仮想環境を作成してアクティブ化します。

    # Windows
    python -m venv .venv
    .venv\Scripts\activate
    
    # Linux/macOS
    python3 -m venv .venv
    source .venv/bin/activate
  3. プロジェクトの依存関係をインストールします。

    # Install Node.js dependencies
    pnpm install
    
    # Install Python dependencies (will be handled by setup.sh)
    ./setup.sh
  4. プロジェクトをビルドします。

    pnpm run build

3. 検証

  1. サーバーを起動します。

    pnpm start
  2. インストールをテストします。

    # Convert a web page
    python convert_utf8.py "https://example.com"
    
    # Convert a local file
    python convert_utf8.py "path/to/your/file.docx"

使用ガイド

基本的な使い方

  1. Webページの変換:

    python convert_utf8.py "https://example.com"

    変換されたマークダウンはconverted_result.mdとして保存されます。

  2. ローカルファイルの変換:

    # Convert DOCX
    python convert_utf8.py "document.docx"
    
    # Convert PDF
    python convert_utf8.py "document.pdf"
    
    # Convert PowerPoint
    python convert_utf8.py "presentation.pptx"
    
    # Convert Excel
    python convert_utf8.py "spreadsheet.xlsx"
  3. YouTube 動画の変換:

    python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"

高度な使用法

  1. 環境変数:

    # Set custom UV path
    export UV_PATH="/custom/path/to/uv"
    
    # Set custom output directory
    export MARKDOWN_OUTPUT_DIR="/custom/output/path"
  2. バッチ処理: URL またはファイル パスを含むバッチ ファイル (例: convert_batch.txt ) を作成します。

    https://example1.com
    https://example2.com
    file1.docx
    file2.pdf

    次に以下を実行します:

    while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt

トラブルシューティング

  1. よくある問題:

    • エンコードエラーが表示される場合は、UTF-8が正しく設定されていることを確認してください。

    • Windowsの権限の問題の場合は、管理者として実行してください

    • Pythonパスの問題の場合は、仮想環境がアクティブになっていることを確認してください

  2. デバッグ:

    # Enable debug output
    export DEBUG=true
    python convert_utf8.py "your_file.docx"

使用法

コマンドライン

WebページをMarkdownに変換する:

python convert_utf8.py "https://example.com"

ローカルファイルを変換:

python convert_utf8.py "path/to/your/file.docx"

デスクトップアプリの統合

このサーバーをデスクトップ アプリと統合するには、アプリのサーバー構成に以下を追加します。

{
  "mcpServers": {
    "markdownify": {
      "command": "node",
      "args": [
        "{ABSOLUTE_PATH}/dist/index.js"
      ],
      "env": {
        "UV_PATH": "/path/to/uv"
      }
    }
  }
}

トラブルシューティング

  1. エンコーディングの問題

    • 文字エンコードの問題が発生した場合は、 PYTHONIOENCODING環境変数がutf-8に設定されていることを確認してください。

    • Windowsユーザーは、UTF-8サポートを有効にするためにchcp 65001実行する必要があるかもしれません。

  2. 権限の問題

    • 十分なファイルの読み取り/書き込み権限があることを確認してください

    • Windowsでは管理者として実行する必要があるかもしれません

謝辞

このプロジェクトは、Zach Caceres 氏のオリジナル作品に基づいています。素晴らしい貢献をしてくださった原作者に感謝申し上げます。

ライセンス

このプロジェクトは引き続きMITライセンスの下でライセンスされます。詳細はLICENSEファイルをご覧ください。

貢献

貢献を歓迎します!プルリクエストを送信する前に、以下の点にご注意ください。

  1. コードがプロジェクトのコーディング標準に準拠していることを確認する

  2. 必要なテストとドキュメントを追加する

  3. READMEの関連セクションを更新する

接触

問題や提案については:

  1. 問題を提出する: https://github.com/JDJR2024/markdownify-mcp-utf8/issues

  2. プルリクエストを作成: https://github.com/JDJR2024/markdownify-mcp-utf8/pulls

  3. メールアドレス: jdidndosmmxmx@gmail.com

Latest Blog Posts

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/JDJR2024/markdownify-mcp-utf8'

If you have feedback or need assistance with the MCP directory API, please join our Discord server