Skip to main content
Glama

Unstructured Document Processor MCP

by MKhalusova

非構造化文書処理機能を提供するモデルコンテキストプロトコルサーバー。このサーバーにより、LLMは非構造化文書からコンテンツを抽出して利用できるようになります。

このリポジトリは現在作業中ですので、注意して進めてください :)

サポートされているファイルの種類:

{".abw", ".bmp", ".csv", ".cwk", ".dbf", ".dif", ".doc", ".docm", ".docx", ".dot", ".dotm", ".eml", ".epub", ".et", ".eth", ".fods", ".gif", ".heic", ".htm", ".html", ".hwp", ".jpeg", ".jpg", ".md", ".mcw", ".mw", ".odt", ".org", ".p7s", ".pages", ".pbd", ".pdf", ".png", ".pot", ".potm", ".ppt", ".pptm", ".pptx", ".prn", ".rst", ".rtf", ".sdp", ".sgl", ".svg", ".sxg", ".tiff", ".txt", ".tsv", ".uof", ".uos1", ".uos2", ".web", ".webp", ".wk2", ".xls", ".xlsb", ".xlsm", ".xlsx", ".xlw", ".xml", ".zabw"}

前提条件: 次のものが必要です:

この MCP を Claude デスクトップに追加する方法についての簡単な要約:

  1. リポジトリをクローンし、UV 環境をセットアップします。
  2. ルート ディレクトリに.envファイルを作成し、次の環境変数を追加します: UNSTRUCTURED_API_KEY
  3. MCP サーバーを実行します: uv run doc_processor.py
  4. ~/Library/Application Support/Claude/に移動し、 claude_desktop_config.jsonを作成します。そのファイルに以下を追加します。
{ "mcpServers": { "unstructured_doc_processor": { "command": "PATH/TO/YOUR/UV", "args": [ "--directory", "ABSOLUTE/PATH/TO/YOUR/unstructured-mcp/", "run", "doc_processor.py" ], "disabled": false } } }
  1. Claude Desktopを再起動してください。これでMCPが使用できるようになります。
-
security - not tested
F
license - not found
-
quality - not tested

local-only server

The server can only run on the client's local machine because it depends on local resources.

LLM がさまざまなファイル形式の非構造化ドキュメントからコンテンツを抽出して使用できるようにするモデル コンテキスト プロトコル サーバー。

Related MCP Servers

  • -
    security
    A
    license
    -
    quality
    A Model Context Protocol server that allows LLMs to interact with web content through standardized tools, currently supporting web scraping functionality.
    Last updated -
    Python
    MIT License
    • Linux
    • Apple
  • A
    security
    F
    license
    A
    quality
    A Model Context Protocol server that enables LLMs to fetch and process web content in multiple formats (HTML, JSON, Markdown, text) with automatic format detection.
    Last updated -
    5
    4
    TypeScript
    • Apple
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that converts various file formats (PDF, PowerPoint, Word, Excel, Images, etc.) to Markdown to make them accessible to LLMs.
    Last updated -
    1
    MIT License
  • A
    security
    A
    license
    A
    quality
    A Model Context Protocol server that enables LLMs to retrieve web content and save it to local files for permanent storage and later access.
    Last updated -
    1
    1
    Python
    MIT License

View all related MCP servers

MCP directory API

We provide all the information about MCP servers via our MCP API.

curl -X GET 'https://glama.ai/api/mcp/v1/servers/MKhalusova/unstructured-mcp'

If you have feedback or need assistance with the MCP directory API, please join our Discord server