Unstructured Document Processor MCP

remote-capable server

The server can be hosted and run remotely because it primarily relies on remote services or has no dependency on the local environment.

Integrations

  • Supports processing JPEG/JPG files to extract content for large language models

  • Supports processing Org files to extract content for large language models

  • Supports processing SVG files to extract content for large language models

非構造化文書処理機能を提供するモデルコンテキストプロトコルサーバー。このサーバーにより、LLMは非構造化文書からコンテンツを抽出して利用できるようになります。

このリポジトリは現在作業中ですので、注意して進めてください :)

サポートされているファイルの種類:

{".abw", ".bmp", ".csv", ".cwk", ".dbf", ".dif", ".doc", ".docm", ".docx", ".dot", ".dotm", ".eml", ".epub", ".et", ".eth", ".fods", ".gif", ".heic", ".htm", ".html", ".hwp", ".jpeg", ".jpg", ".md", ".mcw", ".mw", ".odt", ".org", ".p7s", ".pages", ".pbd", ".pdf", ".png", ".pot", ".potm", ".ppt", ".pptm", ".pptx", ".prn", ".rst", ".rtf", ".sdp", ".sgl", ".svg", ".sxg", ".tiff", ".txt", ".tsv", ".uof", ".uos1", ".uos2", ".web", ".webp", ".wk2", ".xls", ".xlsb", ".xlsm", ".xlsx", ".xlw", ".xml", ".zabw"}

前提条件: 次のものが必要です:

この MCP を Claude デスクトップに追加する方法についての簡単な要約:

  1. リポジトリをクローンし、UV 環境をセットアップします。
  2. ルート ディレクトリに.envファイルを作成し、次の環境変数を追加します: UNSTRUCTURED_API_KEY
  3. MCP サーバーを実行します: uv run doc_processor.py
  4. ~/Library/Application Support/Claude/に移動し、 claude_desktop_config.jsonを作成します。そのファイルに以下を追加します。
{ "mcpServers": { "unstructured_doc_processor": { "command": "PATH/TO/YOUR/UV", "args": [ "--directory", "ABSOLUTE/PATH/TO/YOUR/unstructured-mcp/", "run", "doc_processor.py" ], "disabled": false } } }
  1. Claude Desktopを再起動してください。これでMCPが使用できるようになります。
-
security - not tested
F
license - not found
-
quality - not tested

LLM がさまざまなファイル形式の非構造化ドキュメントからコンテンツを抽出して使用できるようにするモデル コンテキスト プロトコル サーバー。

ID: 6ncg8w9ovd