MCP ドキュメントサーバー
Docling ライブラリを使用してドキュメント処理機能を提供する MCP サーバー。
インストール
pip を使用してパッケージをインストールできます。
使用法
stdio (デフォルト) または SSE トランスポートのいずれかを使用してサーバーを起動します。
uv を使用している場合は、インストールせずにサーバーを直接実行できます。
利用可能なツール
サーバーは次のツールを公開します。
- convert_document : URL またはローカルパスからマークダウン形式にドキュメントを変換します
source
: ドキュメントへの URL またはローカルファイルパス (必須)enable_ocr
: スキャンしたドキュメントのOCRを有効にするかどうか(オプション、デフォルト: false)ocr_language
: OCRの言語コードのリスト、例: ["en", "fr"] (オプション)
- convert_document_with_images : ドキュメントを変換し、埋め込まれた画像を抽出する
source
: ドキュメントへの URL またはローカルファイルパス (必須)enable_ocr
: スキャンしたドキュメントのOCRを有効にするかどうか(オプション、デフォルト: false)ocr_language
: OCRの言語コードのリスト(オプション)
- extract_tables : ドキュメントから表を構造化データとして抽出する
source
: ドキュメントへの URL またはローカルファイルパス (必須)
- convert_batch : 複数のドキュメントをバッチモードで処理する
sources
: ドキュメントへのURLまたはファイルパスのリスト(必須)enable_ocr
: スキャンしたドキュメントのOCRを有効にするかどうか(オプション、デフォルト: false)ocr_language
: OCRの言語コードのリスト(オプション)
- qna_from_document : URL またはローカル パスから YAML 形式で Q&A ドキュメントを作成します
source
: ドキュメントへの URL またはローカルファイルパス (必須)no_of_qnas
: 予想されるQ&Aの数(オプション、デフォルト: 5)- 注: このツールでは、IBM Watson X の資格情報を環境変数として設定する必要があります。
WATSONX_PROJECT_ID
: Watson X プロジェクト IDWATSONX_APIKEY
: IBM Cloud APIキーWATSONX_URL
: Watson X API URL (デフォルト: https://us-south.ml.cloud.ibm.com )
- get_system_info : システム構成と加速ステータスに関する情報を取得します
ラマスタックの例
https://github.com/user-attachments/assets/8ad34e50-cbf7-4ec8-aedd-71c42a5de0a1
このサーバーをLlama Stackと併用することで、LLMアプリケーションにドキュメント処理機能を提供できます。Llama Stackサーバーが稼働していることを確認し、 INFERENCE_MODEL
を設定してください。
キャッシング
サーバーは、繰り返しのリクエストのパフォーマンスを向上させるために、処理済みのドキュメントを~/.cache/mcp-docling/
にキャッシュします。
This server cannot be installed
hybrid server
The server is able to function both locally and remotely, depending on the configuration or use case.
モデル コンテキスト プロトコルを使用してドキュメント処理機能を提供し、ドキュメントのマークダウンへの変換、表の抽出、ドキュメント画像の処理を可能にするサーバーです。
Related Resources
Related MCP Servers
- AsecurityAlicenseAqualityA Model Context Protocol server that provides web content fetching and conversion capabilities.Last updated -4892JavaScriptMIT License
- -securityFlicense-qualityA Model Context Protocol server that allows Claude Desktop to perform document operations on Microsoft Word, Excel, and PDF files including creation, editing, and format conversion.Last updated -9Python
- AsecurityAlicenseAqualityA Model Context Protocol server that converts Markdown content to HTML format.Last updated -12,7812TypeScriptMIT License
- -security-license-qualityA TypeScript-based document processing server that supports various document formats (.docx, .pdf, .xlsx) and integrates with Model Context Protocol SDK for efficient document context management.Last updated -TypeScriptMIT License