Markdownify MCP Server - UTF-8 Enhanced

local-only server

The server can only run on the client’s local machine because it depends on local resources.

Integrations

  • Provides comprehensive conversion of various file formats to Markdown, preserving formatting and structure in the conversion process

  • Converts YouTube videos to Markdown format, including extraction of video transcripts when available

Markdownify MCP サーバー - UTF-8 拡張

これは、UTF-8 エンコードのサポートが改善され、多言語コンテンツの処理が最適化された、オリジナルの Markdownify MCP プロジェクトの拡張バージョンです。

中国語の文書

機能強化

  • 包括的なUTF-8エンコードのサポートを追加
  • 多言語コンテンツの最適化された処理
  • Windowsシステムでのエンコードの問題を修正
  • エラー処理メカニズムの改善

元のプロジェクトとの主な違い

  1. 強化されたエンコーディングサポート:
    • すべての操作で完全な UTF-8 をサポート
    • 中国語、日本語、韓国語、その他の非ASCII文字の適切な処理
    • Windows 固有のエンコードの問題を修正しました (cmd.exe と PowerShell の互換性)
  2. エラー処理の改善:
    • 英語と中国語の両方で詳細なエラーメッセージ
    • ネットワークの問題に対する例外処理の改善
    • 変換失敗時の適切なフォールバックメカニズム
  3. 拡張機能:
    • 複数ファイルのバッチ処理のサポートを追加
    • 強化された YouTube 動画のトランスクリプト処理
    • さまざまなファイル形式からのメタデータ抽出の改善
    • ドキュメントの書式をより適切に保持
  4. パフォーマンスの最適化:
    • 大きなファイルの変換におけるメモリ使用量の最適化
    • 多言語コンテンツの処理の高速化
    • 依存関係の競合の軽減
  5. より良い開発エクスペリエンス:
    • 包括的なデバッグオプション
    • 詳細なログシステム
    • 環境固有の構成サポート
    • 英語と中国語の両方でわかりやすいドキュメント

特徴

さまざまなファイル形式を Markdown に変換することをサポートします。

  • PDFファイル
  • 画像(メタデータ付き)
  • 音声(書き起こし付き)
  • Word文書(DOCX)
  • Excel スプレッドシート (XLSX)
  • PowerPoint プレゼンテーション (PPTX)
  • ウェブコンテンツ:
    • YouTube動画のトランスクリプト
    • 検索結果
    • 一般的なウェブページ
  • 既存のMarkdownファイル

クイックスタート

  1. このリポジトリをクローンします:
    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8
  2. 依存関係をインストールします:
    pnpm install
    注: これにより、 uvおよび関連する Python 依存関係もインストールされます。
  3. プロジェクトをビルドします。
    pnpm run build
  4. サーバーを起動します。
    pnpm start

要件

  • Node.js 16.0以上
  • Python 3.8以上
  • pnpm パッケージマネージャー
  • ギット

詳細なインストールガイド

1. 環境設定

  1. Node.js をインストールします。
  2. pnpmをインストールします。
    npm install -g pnpm pnpm --version
  3. Python をインストールします。
    • Python公式サイトからダウンロード
    • インストール中にPythonがPATHに追加されていることを確認する
    • インストールの確認: python --version
  4. (Windows のみ) UTF-8 サポートを構成する:
    # Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001

2. プロジェクトのセットアップ

  1. リポジトリをクローンします。
    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8
  2. Python 仮想環境を作成してアクティブ化します。
    # Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activate
  3. プロジェクトの依存関係をインストールします。
    # Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.sh
  4. プロジェクトをビルドします。
    pnpm run build

3. 検証

  1. サーバーを起動します。
    pnpm start
  2. インストールをテストします。
    # Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"

使用ガイド

基本的な使い方

  1. Webページの変換:
    python convert_utf8.py "https://example.com"
    変換されたマークダウンはconverted_result.mdとして保存されます。
  2. ローカルファイルの変換:
    # Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"
  3. YouTube 動画の変換:
    python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"

高度な使用法

  1. 環境変数:
    # Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"
  2. バッチ処理: URL またはファイル パスを含むバッチ ファイル (例: convert_batch.txt ) を作成します。
    https://example1.com https://example2.com file1.docx file2.pdf
    次に以下を実行します:
    while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt

トラブルシューティング

  1. よくある問題:
    • エンコードエラーが表示される場合は、UTF-8が正しく設定されていることを確認してください。
    • Windowsの権限の問題の場合は、管理者として実行してください
    • Pythonパスの問題の場合は、仮想環境がアクティブになっていることを確認してください
  2. デバッグ:
    # Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"

使用法

コマンドライン

WebページをMarkdownに変換する:

python convert_utf8.py "https://example.com"

ローカルファイルを変換:

python convert_utf8.py "path/to/your/file.docx"

デスクトップアプリの統合

このサーバーをデスクトップ アプリと統合するには、アプリのサーバー構成に以下を追加します。

{ "mcpServers": { "markdownify": { "command": "node", "args": [ "{ABSOLUTE_PATH}/dist/index.js" ], "env": { "UV_PATH": "/path/to/uv" } } } }

トラブルシューティング

  1. エンコーディングの問題
    • 文字エンコードの問題が発生した場合は、 PYTHONIOENCODING環境変数がutf-8に設定されていることを確認してください。
    • Windowsユーザーは、UTF-8サポートを有効にするためにchcp 65001実行する必要があるかもしれません。
  2. 権限の問題
    • 十分なファイルの読み取り/書き込み権限があることを確認してください
    • Windowsでは管理者として実行する必要があるかもしれません

謝辞

このプロジェクトは、Zach Caceres 氏のオリジナル作品に基づいています。素晴らしい貢献をしてくださった原作者に感謝申し上げます。

ライセンス

このプロジェクトは引き続きMITライセンスの下でライセンスされます。詳細はLICENSEファイルをご覧ください。

貢献

貢献を歓迎します!プルリクエストを送信する前に、以下の点にご注意ください。

  1. コードがプロジェクトのコーディング標準に準拠していることを確認する
  2. 必要なテストとドキュメントを追加する
  3. READMEの関連セクションを更新する

接触

問題や提案については:

  1. 問題を提出する: https://github.com/JDJR2024/markdownify-mcp-utf8/issues
  2. プルリクエストを作成: https://github.com/JDJR2024/markdownify-mcp-utf8/pulls
  3. メールアドレス: jdidndosmmxmx@gmail.com

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

多言語および UTF-8 サポートが強化された、さまざまなファイル形式 (PDF、ドキュメント、画像、オーディオ、Web コンテンツ) を Markdown に変換するドキュメント変換サーバーです。

  1. Enhancements
    1. Key Differences from Original Project
      1. Features
        1. Quick Start
          1. Requirements
            1. Detailed Installation Guide
              1. 1. Environment Setup
              2. 2. Project Setup
              3. 3. Verification
            2. Usage Guide
              1. Basic Usage
              2. Advanced Usage
              3. Troubleshooting
            3. Usage
              1. Command Line
              2. Desktop App Integration
            4. Troubleshooting
              1. Acknowledgments
                1. License
                  1. Contributing
                    1. Contact
                      ID: 51hyoj300s