Skip to main content
Glama

Markdownify MCP Server - UTF-8 Enhanced

by JDJR2024

Markdownify MCP サーバー - UTF-8 拡張

これは、UTF-8 エンコードのサポートが改善され、多言語コンテンツの処理が最適化された、オリジナルの Markdownify MCP プロジェクトの拡張バージョンです。

中国語の文書

機能強化

  • 包括的なUTF-8エンコードのサポートを追加
  • 多言語コンテンツの最適化された処理
  • Windowsシステムでのエンコードの問題を修正
  • エラー処理メカニズムの改善

元のプロジェクトとの主な違い

  1. 強化されたエンコーディングサポート:
    • すべての操作で完全な UTF-8 をサポート
    • 中国語、日本語、韓国語、その他の非ASCII文字の適切な処理
    • Windows 固有のエンコードの問題を修正しました (cmd.exe と PowerShell の互換性)
  2. エラー処理の改善:
    • 英語と中国語の両方で詳細なエラーメッセージ
    • ネットワークの問題に対する例外処理の改善
    • 変換失敗時の適切なフォールバックメカニズム
  3. 拡張機能:
    • 複数ファイルのバッチ処理のサポートを追加
    • 強化された YouTube 動画のトランスクリプト処理
    • さまざまなファイル形式からのメタデータ抽出の改善
    • ドキュメントの書式をより適切に保持
  4. パフォーマンスの最適化:
    • 大きなファイルの変換におけるメモリ使用量の最適化
    • 多言語コンテンツの処理の高速化
    • 依存関係の競合の軽減
  5. より良い開発エクスペリエンス:
    • 包括的なデバッグオプション
    • 詳細なログシステム
    • 環境固有の構成サポート
    • 英語と中国語の両方でわかりやすいドキュメント

特徴

さまざまなファイル形式を Markdown に変換することをサポートします。

  • PDFファイル
  • 画像(メタデータ付き)
  • 音声(書き起こし付き)
  • Word文書(DOCX)
  • Excel スプレッドシート (XLSX)
  • PowerPoint プレゼンテーション (PPTX)
  • ウェブコンテンツ:
    • YouTube動画のトランスクリプト
    • 検索結果
    • 一般的なウェブページ
  • 既存のMarkdownファイル

クイックスタート

  1. このリポジトリをクローンします:
    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8
  2. 依存関係をインストールします:
    pnpm install
    注: これにより、 uvおよび関連する Python 依存関係もインストールされます。
  3. プロジェクトをビルドします。
    pnpm run build
  4. サーバーを起動します。
    pnpm start

要件

  • Node.js 16.0以上
  • Python 3.8以上
  • pnpm パッケージマネージャー
  • ギット

詳細なインストールガイド

1. 環境設定

  1. Node.js をインストールします。
  2. pnpmをインストールします。
    npm install -g pnpm pnpm --version
  3. Python をインストールします。
    • Python公式サイトからダウンロード
    • インストール中にPythonがPATHに追加されていることを確認する
    • インストールの確認: python --version
  4. (Windows のみ) UTF-8 サポートを構成する:
    # Set system-wide UTF-8 setx PYTHONIOENCODING UTF-8 # Set current session UTF-8 set PYTHONIOENCODING=UTF-8 # Enable UTF-8 in command prompt chcp 65001

2. プロジェクトのセットアップ

  1. リポジトリをクローンします。
    git clone https://github.com/JDJR2024/markdownify-mcp-utf8.git cd markdownify-mcp-utf8
  2. Python 仮想環境を作成してアクティブ化します。
    # Windows python -m venv .venv .venv\Scripts\activate # Linux/macOS python3 -m venv .venv source .venv/bin/activate
  3. プロジェクトの依存関係をインストールします。
    # Install Node.js dependencies pnpm install # Install Python dependencies (will be handled by setup.sh) ./setup.sh
  4. プロジェクトをビルドします。
    pnpm run build

3. 検証

  1. サーバーを起動します。
    pnpm start
  2. インストールをテストします。
    # Convert a web page python convert_utf8.py "https://example.com" # Convert a local file python convert_utf8.py "path/to/your/file.docx"

使用ガイド

基本的な使い方

  1. Webページの変換:
    python convert_utf8.py "https://example.com"
    変換されたマークダウンはconverted_result.mdとして保存されます。
  2. ローカルファイルの変換:
    # Convert DOCX python convert_utf8.py "document.docx" # Convert PDF python convert_utf8.py "document.pdf" # Convert PowerPoint python convert_utf8.py "presentation.pptx" # Convert Excel python convert_utf8.py "spreadsheet.xlsx"
  3. YouTube 動画の変換:
    python convert_utf8.py "https://www.youtube.com/watch?v=VIDEO_ID"

高度な使用法

  1. 環境変数:
    # Set custom UV path export UV_PATH="/custom/path/to/uv" # Set custom output directory export MARKDOWN_OUTPUT_DIR="/custom/output/path"
  2. バッチ処理: URL またはファイル パスを含むバッチ ファイル (例: convert_batch.txt ) を作成します。
    https://example1.com https://example2.com file1.docx file2.pdf
    次に以下を実行します:
    while read -r line; do python convert_utf8.py "$line"; done < convert_batch.txt

トラブルシューティング

  1. よくある問題:
    • エンコードエラーが表示される場合は、UTF-8が正しく設定されていることを確認してください。
    • Windowsの権限の問題の場合は、管理者として実行してください
    • Pythonパスの問題の場合は、仮想環境がアクティブになっていることを確認してください
  2. デバッグ:
    # Enable debug output export DEBUG=true python convert_utf8.py "your_file.docx"

使用法

コマンドライン

WebページをMarkdownに変換する:

python convert_utf8.py "https://example.com"

ローカルファイルを変換:

python convert_utf8.py "path/to/your/file.docx"

デスクトップアプリの統合

このサーバーをデスクトップ アプリと統合するには、アプリのサーバー構成に以下を追加します。

{ "mcpServers": { "markdownify": { "command": "node", "args": [ "{ABSOLUTE_PATH}/dist/index.js" ], "env": { "UV_PATH": "/path/to/uv" } } } }

トラブルシューティング

  1. エンコーディングの問題
    • 文字エンコードの問題が発生した場合は、 PYTHONIOENCODING環境変数がutf-8に設定されていることを確認してください。
    • Windowsユーザーは、UTF-8サポートを有効にするためにchcp 65001実行する必要があるかもしれません。
  2. 権限の問題
    • 十分なファイルの読み取り/書き込み権限があることを確認してください
    • Windowsでは管理者として実行する必要があるかもしれません

謝辞

このプロジェクトは、Zach Caceres 氏のオリジナル作品に基づいています。素晴らしい貢献をしてくださった原作者に感謝申し上げます。

ライセンス

このプロジェクトは引き続きMITライセンスの下でライセンスされます。詳細はLICENSEファイルをご覧ください。

貢献

貢献を歓迎します!プルリクエストを送信する前に、以下の点にご注意ください。

  1. コードがプロジェクトのコーディング標準に準拠していることを確認する
  2. 必要なテストとドキュメントを追加する
  3. READMEの関連セクションを更新する

接触

問題や提案については:

  1. 問題を提出する: https://github.com/JDJR2024/markdownify-mcp-utf8/issues
  2. プルリクエストを作成: https://github.com/JDJR2024/markdownify-mcp-utf8/pulls
  3. メールアドレス: jdidndosmmxmx@gmail.com

You must be authenticated.

A
security – no known vulnerabilities
A
license - permissive license
A
quality - confirmed to work

hybrid server

The server is able to function both locally and remotely, depending on the configuration or use case.

多言語および UTF-8 サポートが強化された、さまざまなファイル形式 (PDF、ドキュメント、画像、オーディオ、Web コンテンツ) を Markdown に変換するドキュメント変換サーバーです。

  1. 機能強化
    1. 元のプロジェクトとの主な違い
      1. 特徴
        1. クイックスタート
          1. 要件
            1. 詳細なインストールガイド
              1. 環境設定
              2. プロジェクトのセットアップ
              3. 検証
            2. 使用ガイド
              1. 基本的な使い方
              2. 高度な使用法
              3. トラブルシューティング
            3. 使用法
              1. コマンドライン
              2. デスクトップアプリの統合
            4. トラブルシューティング
              1. 謝辞
                1. ライセンス
                  1. 貢献
                    1. 接触

                      Related MCP Servers

                      • A
                        security
                        F
                        license
                        A
                        quality
                        An MCP server for converting Markdown documents to PDF files.
                        Last updated -
                        1
                        1
                        JavaScript
                      • A
                        security
                        A
                        license
                        A
                        quality
                        Converts various file types and web content to Markdown format. It provides a set of tools to transform PDFs, images, audio files, web pages, and more into easily readable and shareable Markdown text.
                        Last updated -
                        10
                        2
                        1,611
                        TypeScript
                        MIT License
                        • Apple
                      • A
                        security
                        A
                        license
                        A
                        quality
                        This server converts webpages into clean, structured Markdown optimized for language model consumption, removing unnecessary content and supporting JavaScript rendering.
                        Last updated -
                        1
                        5
                        JavaScript
                        MIT License
                        • Apple
                      • A
                        security
                        A
                        license
                        A
                        quality
                        Converts various file formats to Markdown using the MarkItDown utility and can be integrated with MCP clients for seamless document processing and conversion.
                        Last updated -
                        26
                        Python
                        MIT License

                      View all related MCP servers

                      MCP directory API

                      We provide all the information about MCP servers via our MCP API.

                      curl -X GET 'https://glama.ai/api/mcp/v1/servers/JDJR2024/markdownify-mcp-utf8'

                      If you have feedback or need assistance with the MCP directory API, please join our Discord server