[{"_1":2,"_344":-5,"_345":-5},"loaderData",{"_3":4,"_29":30,"_277":278},"root",{"_5":6,"_14":15},"toasts",[7],{"_8":9,"_10":11,"_12":13},"uid","019a2ace-9495-767a-8ca8-cb09dc3f1566","title","You need to sign in to access this page","type","error","visitor",{"_16":17,"_18":19},"viewportWidth",1280,"visitorSession",{"_20":21,"_23":24,"_25":-5,"_26":27,"_28":-5},"attributes",[22],"bot","id",21005410,"membership","referenceId","019a17bf-377c-71fd-947e-fd17d1ca8e82","userAccount","routes/_public/mcp/servers/~namespace/~slug/_pages/_layout",{"_31":32,"_87":-5,"_88":45,"_34":89,"_193":194,"_275":276},"availableLocales",[33,45,52,59,66,73,80],{"_34":35,"_38":42,"_43":44},"mcpServer",{"_36":37,"_38":39,"_40":41},"description","Eine MCP-Serverimplementierung, die die Interaktion mit der unstrukturierten API ermöglicht und Tools zum Auflisten, Erstellen, Aktualisieren und Verwalten von Quellen, Zielen und Workflows bereitstellt.","name","Unstrukturierter API-MCP-Server","readme","# Unstrukturierter API-MCP-Server\n\nEine MCP-Serverimplementierung für die Interaktion mit der unstrukturierten API. Dieser Server bietet Tools zum Auflisten von Quellen und Workflows.\n\n## Verfügbare Tools\n\n| Werkzeug | Beschreibung |\n| ----------------------------------- | --------------------------------------------------------------------------------------------------------------------------- |\n| `list_sources` | Listet verfügbare Quellen aus der unstrukturierten API auf. |\n| `get_source_info` | Erhalten Sie detaillierte Informationen zu einem bestimmten Quell-Connector. |\n| `create_source_connector` | Erstellen Sie einen Quellkonnektor.) |\n| `update_source_connector` | Aktualisieren Sie einen vorhandenen Quellkonnektor durch Parameter. |\n| `delete_source_connector` | Löschen Sie einen Quellkonnektor anhand der Quell-ID. |\n| `list_destinations` | Listet verfügbare Ziele aus der unstrukturierten API auf. |\n| `get_destination_info` | Erhalten Sie detaillierte Informationen zu einem bestimmten Ziel-Connector |\n| `create_destination_connector` | Erstellen Sie einen Zielkonnektor anhand von Parametern. |\n| `update_destination_connector` | Aktualisieren Sie einen vorhandenen Ziel-Connector anhand der Ziel-ID. |\n| `delete_destination_connector` | Löschen Sie einen Zielkonnektor anhand der Ziel-ID. |\n| `list_workflows` | Listet Workflows aus der unstrukturierten API auf. |\n| `get_workflow_info` | Erhalten Sie detaillierte Informationen zu einem bestimmten Workflow. |\n| `create_workflow` | Erstellen Sie einen neuen Workflow mit Quell-, Ziel-ID usw. |\n| `run_workflow` | Führen Sie einen bestimmten Workflow mit der Workflow-ID aus |\n| `update_workflow` | Aktualisieren Sie einen vorhandenen Workflow anhand von Parametern. |\n| `delete_workflow` | Löschen Sie einen bestimmten Workflow nach ID. |\n| `list_jobs` | Listet Jobs für einen bestimmten Workflow aus der unstrukturierten API auf. |\n| `get_job_info` | Erhalten Sie anhand der Job-ID detaillierte Informationen zu einem bestimmten Job. |\n| `cancel_job` | Löschen Sie einen bestimmten Job anhand der ID. |\n| `list_workflows_with_finished_jobs` | Listet alle Workflows auf, die über abgeschlossene Aufträge verfügen, zusammen mit Informationen zu Quell- und Zieldetails. |\n\nNachfolgend finden Sie eine Liste der Konnektoren, die der `UNS-MCP` -Server aktuell unterstützt. Die vollständige Liste der von der Unstructured-Plattform unterstützten Quellkonnektoren [finden Sie hier](https://docs.unstructured.io/api-reference/workflow/sources/overview) und die Zielkonnektoren [hier](https://docs.unstructured.io/api-reference/workflow/destinations/overview) . Wir planen, weitere hinzuzufügen!\n\n| Quelle | Ziel |\n| ------------ | ----------------------------------- |\n| S3 | S3 |\n| Azurblau | Weaviate |\n| Google Drive | Tannenzapfen |\n| OneDrive | AstraDB |\n| Salesforce | MongoDB |\n| SharePoint | Neo4j |\n| | Databricks-Volumes |\n| | Deltatabelle für Databricks-Volumes |\n\nUm das Tool zum Erstellen/Aktualisieren/Löschen eines Connectors verwenden zu können, müssen die Anmeldeinformationen für diesen Connector in Ihrer .env-Datei definiert sein. Nachfolgend finden Sie die `credentials` für die von uns unterstützten Connectors:\n\n| Anmeldeinformationsname | Beschreibung |\n| -------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |\n| `ANTHROPIC_API_KEY` | erforderlich, um den `minimal_client` auszuführen und mit unserem Server zu interagieren. |\n| `AWS_KEY` , `AWS_SECRET` | erforderlich, um einen S3-Connector über `uns-mcp` -Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/api-reference/workflow/sources/s3) und [hier](https://docs.unstructured.io/api-reference/workflow/destinations/s3) |\n| `WEAVIATE_CLOUD_API_KEY` | erforderlich, um den Weaviate-Vektor-DB-Connector zu erstellen. Weitere Informationen finden Sie in [der Dokumentation.](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate) |\n| `FIRECRAWL_API_KEY` | erforderlich, um Firecrawl-Tools in `external/firecrawl.py` zu verwenden, sich bei [Firecrawl](https://www.firecrawl.dev/) anzumelden und einen API-Schlüssel zu erhalten. |\n| `ASTRA_DB_APPLICATION_TOKEN` , `ASTRA_DB_API_ENDPOINT` | erforderlich, um einen Astradb-Connector über `uns-mcp` -Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/ui/destinations/astradb) |\n| `AZURE_CONNECTION_STRING` | erforderliche Option 1 zum Erstellen eines Azure-Connectors über `uns-mcp` Server, siehe [Dokumentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME` + `AZURE_ACCOUNT_KEY` | erforderliche Option 2 zum Erstellen eines Azure-Connectors über `uns-mcp` Server, siehe [Dokumentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME` + `AZURE_SAS_TOKEN` | erforderliche Option 3 zum Erstellen eines Azure-Connectors über `uns-mcp` Server, siehe [Dokumentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `NEO4J_PASSWORD` | erforderlich, um einen Neo4j-Connector über `uns-mcp` -Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/ui/destinations/neo4j) |\n| `MONGO_DB_CONNECTION_STRING` | erforderlich, um einen MongoDB-Connector über `uns-mcp` -Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/ui/destinations/mongodb) |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | ein String-Wert. Der ursprüngliche Server-Kontoschlüssel (siehe [Dokumentation](https://docs.unstructured.io/ui/sources/google-drive) ) befindet sich in einer JSON-Datei. Führen Sie `base64 < /path/to/google_service_account_key.json` im Terminal aus, um den String-Wert abzurufen. |\n| `DATABRICKS_CLIENT_ID` , `DATABRICKS_CLIENT_SECRET` | erforderlich, um einen Databricks-Volume-/Delta-Tabellen-Connector über `uns-mcp` Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/ui/destinations/databricks-volumes) und [hier](https://docs.unstructured.io/ui/destinations/databricks-delta-table) |\n| `ONEDRIVE_CLIENT_ID` , `ONEDRIVE_CLIENT_CRED` , `ONEDRIVE_TENANT_ID` | erforderlich, um einen One Drive-Connector über `uns-mcp` -Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/ui/destinations/onedrive) |\n| `PINECONE_API_KEY` | erforderlich, um einen Pinecone-Vektor-DB-Connector über `uns-mcp` Server zu erstellen, siehe [Dokumentation](https://docs.unstructured.io/ui/destinations/pinecone) |\n| `SALESFORCE_CONSUMER_KEY` , `SALESFORCE_PRIVATE_KEY` | erforderlich, um den Salesforce-Quellconnector über `uns-mcp` -Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/ingestion/source-connectors/salesforce) |\n| `SHAREPOINT_CLIENT_ID` , `SHAREPOINT_CLIENT_CRED` , `SHAREPOINT_TENANT_ID` | erforderlich, um einen One Drive-Connector über `uns-mcp` -Server zu erstellen. Weitere Informationen finden Sie in [der Dokumentation](https://docs.unstructured.io/ui/sources/sharepoint) |\n| `LOG_LEVEL` | Wird verwendet, um die Protokollierungsebene für unseren `minimal_client` festzulegen, z. B. auf ERROR, um alles zu erhalten |\n| `CONFIRM_TOOL_USE` | auf „true“ setzen, damit `minimal_client` die Ausführung vor jedem Tool-Aufruf bestätigen kann |\n| `DEBUG_API_REQUESTS` | auf true setzen, damit `uns_mcp/server.py` Anforderungsparameter für ein besseres Debugging ausgeben kann |\n\n### Firecrawl-Quelle\n\n[Firecrawl](https://www.firecrawl.dev/) ist eine Web-Crawling-API, die in unserem MCP zwei Hauptfunktionen bietet:\n\n1. **Abrufen von HTML-Inhalten** : Verwenden Sie `invoke_firecrawl_crawlhtml` , um Crawl-Jobs zu starten, und `check_crawlhtml_status` um sie zu überwachen\n2. **LLM-optimierte Textgenerierung** : Verwenden von `invoke_firecrawl_llmtxt` zum Generieren von Text und `check_llmtxt_status` zum Abrufen von Ergebnissen\n\nSo funktioniert Firecrawl:\n\n**Web-Crawling-Prozess:**\n\n* Beginnt mit einer angegebenen URL und analysiert diese, um Links zu identifizieren\n* Verwendet die Sitemap, sofern verfügbar; folgt andernfalls den auf der Website gefundenen Links.\n* Durchläuft rekursiv jeden Link, um alle Unterseiten zu entdecken\n* Sammelt Inhalte von jeder besuchten Seite und kümmert sich um JavaScript-Rendering und Ratenbegrenzungen\n* Jobs können bei Bedarf mit `cancel_crawlhtml_job` abgebrochen werden\n* Verwenden Sie dies, wenn Sie alle Informationen in reines HTML extrahieren möchten. Der Workflow von Unstructured bereinigt das wirklich gut :smile:\n\n**LLM-Textgenerierung:**\n\n* Extrahiert nach dem Crawlen sauberen, aussagekräftigen Textinhalt aus den gecrawlten Seiten\n* Generiert optimierte Textformate, die speziell für große Sprachmodelle formatiert sind\n* Die Ergebnisse werden automatisch an den angegebenen S3-Speicherort hochgeladen.\n* Hinweis: LLM-Textgenerierungsaufträge können nach dem Start nicht mehr abgebrochen werden. Die Funktion `cancel_llmtxt_job` dient der Konsistenz, wird aber derzeit nicht von der Firecrawl-API unterstützt.\n\nHinweis: Um diese Funktionen zu verwenden, muss eine Umgebungsvariable `FIRECRAWL_API_KEY` festgelegt werden.\n\n## Installation und Konfiguration\n\nDieses Handbuch enthält schrittweise Anweisungen zum Einrichten und Konfigurieren des UNS\\_MCP-Servers mit Python 3.12 und dem `uv` Tool.\n\n## Voraussetzungen\n\n* Python 3.12+\n* `uv` für Umweltmanagement\n* Ein API-Schlüssel von Unstructured. Sie können sich [hier](https://platform.unstructured.io/app/account/api-keys) anmelden und Ihren API-Schlüssel erhalten.\n\n### Verwendung von `uv` (empfohlen)\n\nBei Verwendung von `uvx` ist keine zusätzliche Installation erforderlich, da uvx die Ausführung übernimmt. Wenn Sie das Paket jedoch lieber direkt installieren möchten:\n\n```bash\nuv pip install uns_mcp\n```\n\n#### Claude Desktop konfigurieren\n\nFügen Sie zur Integration mit Claude Desktop den folgenden Inhalt zu Ihrer `claude_desktop_config.json` hinzu:\n\n**Hinweis:** Die Datei befindet sich im Verzeichnis `~/Library/Application Support/Claude/` .\n\n**Verwenden `uvx` -Befehls:**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**Alternativ können Sie das Python-Paket verwenden:**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### Verwenden von Quellcode\n\n1. Klonen Sie das Repository.\n\n2. Installieren Sie Abhängigkeiten:\n\n ```bash\n uv sync\n ```\n\n3. Legen Sie Ihren unstrukturierten API-Schlüssel als Umgebungsvariable fest. Erstellen Sie im Stammverzeichnis eine .env-Datei mit folgendem Inhalt:\n\n ```bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ```\n\n Die konfigurierbaren Umgebungsvariablen finden Sie unter `.env.template` .\n\nSie können den Server jetzt mit einer der folgenden Methoden ausführen:\n\n```bash\nuvx pip install -e .\n```\n\nAktualisieren Sie Ihre Claude Desktop-Konfiguration:\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"]\n }\n }\n}\n```\n\n**Hinweis** : Denken Sie daran, auf die ausführbare Datei uvx in der Umgebung zu verweisen, in der Sie das Paket installiert haben\n\n**Hinweis: Wird von Claude Desktop nicht unterstützt.**\n\nBeim SSE-Protokoll können Sie das Debuggen einfacher durchführen, indem Sie Client und Server entkoppeln:\n\n1. Starten Sie den Server in einem Terminal:\n\n ```bash\n uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080\n # or\n make sse-server\n ```\n\n2. Testen Sie den Server mit einem lokalen Client in einem anderen Terminal:\n\n ```bash\n uv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\"\n # or\n make sse-client\n ```\n\n**Hinweis:** Um die Dienste zu stoppen, verwenden Sie zuerst `Ctrl+C` auf dem Client und dann auf dem Server.\n\nKonfigurieren Sie Claude Desktop für die Verwendung von stdio:\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"ABSOLUTE/PATH/TO/.local/bin/uv\",\n \"args\": [\n \"--directory\",\n \"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp\",\n \"run\",\n \"server.py\"\n ]\n }\n }\n}\n```\n\nAlternativ können Sie den lokalen Client ausführen:\n\n```bash\nuv run python minimal_client/client.py uns_mcp/server.py\n```\n\n## Zusätzliche lokale Clientkonfiguration\n\nKonfigurieren Sie den Minimal-Client mithilfe von Umgebungsvariablen:\n\n* `LOG_LEVEL=\"ERROR\"` : Wird so eingestellt, dass Debug-Ausgaben vom LLM unterdrückt werden und den Benutzern klare Meldungen angezeigt werden.\n* `CONFIRM_TOOL_USE='false'` : Deaktiviert die Bestätigung der Tool-Nutzung vor der Ausführung. **Verwenden Sie diese Option mit Vorsicht** , insbesondere während der Entwicklung, da LLM möglicherweise aufwändige Workflows ausführt oder Daten löscht.\n\n#### Debugging-Tools\n\nAnthropic bietet das Tool `MCP Inspector` zum Debuggen/Testen Ihres MCP-Servers. Führen Sie den folgenden Befehl aus, um eine Debug-Oberfläche zu öffnen. Von dort aus können Sie im linken Bereich Umgebungsvariablen hinzufügen (die auf Ihre lokale Umgebung verweisen). Fügen Sie dort Ihren persönlichen API-Schlüssel als Umgebungsvariable ein. Unter `tools` können Sie die Funktionen testen, die Sie dem MCP-Server hinzufügen.\n\n```\nmcp dev uns_mcp/server.py\n```\n\nWenn Sie Anforderungsaufrufparameter für `UnstructuredClient` protokollieren müssen, setzen Sie die Umgebungsvariable `DEBUG_API_REQUESTS=false` . Die Protokolle werden in einer Datei im Format `unstructured-client-{date}.log` gespeichert, die zum Debuggen von Anforderungsaufrufparametern für `UnstructuredClient` -Funktionen untersucht werden kann.\n\n## Terminalzugriff zum Minimal-Client hinzufügen\n\nWir verwenden [@wonderwhy-er/desktop-commander](https://github.com/wonderwhy-er/DesktopCommanderMCP) , um dem Minimal-Client Terminalzugriff hinzuzufügen. Er basiert auf dem MCP-Dateisystemserver. Vorsicht: Der Client (auch LLM) **hat nun Zugriff auf private Dateien.**\n\nFühren Sie den folgenden Befehl aus, um das Paket zu installieren:\n\n```bash\nnpx @wonderwhy-er/desktop-commander setup\n```\n\nStarten Sie dann den Client mit zusätzlichen Parametern:\n\n```bash\nuv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\" \"@wonderwhy-er/desktop-commander\"\n# or\nmake sse-client-terminal\n```\n\n## Verwenden einer Teilmenge von Tools\n\nWenn Ihr Client nur die Verwendung einer Teilmenge von Tools unterstützt, sollten Sie Folgendes beachten:\n\n* Das Tool `update_workflow` muss im Kontext zusammen mit dem Tool `create_workflow` geladen werden, da es eine detaillierte Beschreibung zum Erstellen und Konfigurieren eines benutzerdefinierten Knotens enthält.\n\n## Bekannte Probleme\n\n* `update_workflow` – muss die Konfiguration des Workflows im Kontext haben, den es aktualisiert, entweder indem es vom Benutzer bereitgestellt wird oder indem das Tool `get_workflow_info` aufgerufen wird, da dieses Tool nicht als `patch` Applier funktioniert, sondern die Workflow-Konfiguration vollständig ersetzt.\n\n## ÄNDERUNGSPROTOKOLL.md\n\nAlle neu entwickelten Funktionen/Fixes/Erweiterungen werden zu CHANGELOG.md hinzugefügt. Bevor wir zu einer stabilen Version übergehen, wird das Vorabversionsformat 0.xx-dev bevorzugt.\n\n# Fehlerbehebung\n\n* Wenn Sie auf Probleme mit `Error: spawn ENOENT` stoßen, bedeutet dies, dass `` nicht installiert ist oder in Ihrem PATH nicht sichtbar ist:\n * Stellen Sie sicher, dass Sie es installieren und zu Ihrem PATH hinzufügen.\n * oder geben Sie den absoluten Pfad zum Befehl im `command` Ihrer Konfiguration an. Ersetzen Sie beispielsweise `python` durch `/opt/miniconda3/bin/python`","German","tag","de-DE",{"_34":46,"_38":50,"_43":51},{"_36":47,"_38":48,"_40":49},"An MCP server implementation that enables interaction with the Unstructured API, providing tools to list, create, update, and manage sources, destinations, and workflows.","Unstructured API MCP Server","# Unstructured API MCP Server\n\nAn MCP server implementation for interacting with the Unstructured API. This server provides tools to list sources and workflows.\n\n## Available Tools\n\n| Tool | Description |\n|-------------------------------------|------------------------------------------------------------------------------------------------------------------|\n| `list_sources` | Lists available sources from the Unstructured API. |\n| `get_source_info` | Get detailed information about a specific source connector. |\n| `create_source_connector` | Create a source connector.) |\n| `update_source_connector` | Update an existing source connector by params. |\n| `delete_source_connector` | Delete a source connector by source id. |\n| `list_destinations` | Lists available destinations from the Unstructured API. |\n| `get_destination_info` | Get detailed info about a specific destination connector |\n| `create_destination_connector` | Create a destination connector by params. |\n| `update_destination_connector` | Update an existing destination connector by destination id. |\n| `delete_destination_connector` | Delete a destination connector by destination id. |\n| `list_workflows` | Lists workflows from the Unstructured API. |\n| `get_workflow_info` | Get detailed information about a specific workflow. |\n| `create_workflow` | Create a new workflow with source, destination id, etc. |\n| `run_workflow` | Run a specific workflow with workflow id |\n| `update_workflow` | Update an existing workflow by params. |\n| `delete_workflow` | Delete a specific workflow by id. |\n| `list_jobs` | Lists jobs for a specific workflow from the Unstructured API. |\n| `get_job_info` | Get detailed information about a specific job by job id. |\n| `cancel_job` | Delete a specific job by id. |\n| `list_workflows_with_finished_jobs` | Lists all workflows that have any completed job, together with information about source and destination details. |\n\nBelow is a list of connectors the `UNS-MCP` server currently supports, please see the full list of source connectors that Unstructured platform supports [here](https://docs.unstructured.io/api-reference/workflow/sources/overview) and destination list [here](https://docs.unstructured.io/api-reference/workflow/destinations/overview). We are planning on adding more!\n\n| Source | Destination |\n|--------------|--------------------------------|\n| S3 | S3 |\n| Azure | Weaviate |\n| Google Drive | Pinecone |\n| OneDrive | AstraDB |\n| Salesforce | MongoDB |\n| Sharepoint | Neo4j |\n| | Databricks Volumes |\n| | Databricks Volumes Delta Table |\n\n\nTo use the tool that creates/updates/deletes a connector, the credentials for that specific connector must be defined in your .env file. Below is the list of `credentials` for the connectors we support:\n\n| Credential Name | Description |\n|-------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| `ANTHROPIC_API_KEY` | required to run the `minimal_client` to interact with our server. |\n| `AWS_KEY`, `AWS_SECRET` | required to create S3 connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/api-reference/workflow/sources/s3) and [here](https://docs.unstructured.io/api-reference/workflow/destinations/s3) |\n| `WEAVIATE_CLOUD_API_KEY` | required to create Weaviate vector db connector, see how in [documentation](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate) |\n| `FIRECRAWL_API_KEY` | required to use Firecrawl tools in `external/firecrawl.py`, sign up on [Firecrawl](https://www.firecrawl.dev/) and get an API key. |\n| `ASTRA_DB_APPLICATION_TOKEN`, `ASTRA_DB_API_ENDPOINT` | required to create Astradb connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/astradb) |\n| `AZURE_CONNECTION_STRING` | required option 1 to create Azure connector via ``uns-mcp`` server, see how in [documentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME`+`AZURE_ACCOUNT_KEY` | required option 2 to create Azure connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME`+`AZURE_SAS_TOKEN` | required option 3 to create Azure connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `NEO4J_PASSWORD` | required to create Neo4j connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/neo4j) |\n| `MONGO_DB_CONNECTION_STRING` | required to create Mongodb connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/mongodb) |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | a string value. The original server account key (follow [documentation](https://docs.unstructured.io/ui/sources/google-drive)) is in json file, run `base64 < /path/to/google_service_account_key.json` in terminal to get the string value |\n| `DATABRICKS_CLIENT_ID`,`DATABRICKS_CLIENT_SECRET` | required to create Databricks volume/delta table connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/databricks-volumes) and [here](https://docs.unstructured.io/ui/destinations/databricks-delta-table) |\n| `ONEDRIVE_CLIENT_ID`, `ONEDRIVE_CLIENT_CRED`,`ONEDRIVE_TENANT_ID` | required to create One Drive connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/onedrive) |\n| `PINECONE_API_KEY` | required to create Pinecone vector DB connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/pinecone) |\n| `SALESFORCE_CONSUMER_KEY`,`SALESFORCE_PRIVATE_KEY` | required to create salesforce source connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ingestion/source-connectors/salesforce) |\n| `SHAREPOINT_CLIENT_ID`, `SHAREPOINT_CLIENT_CRED`,`SHAREPOINT_TENANT_ID` | required to create One Drive connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/sources/sharepoint) |\n| `LOG_LEVEL` | Used to set logging level for our `minimal_client`, e.g. set to ERROR to get everything |\n| `CONFIRM_TOOL_USE` | set to true so that `minimal_client` can confirm execution before each tool call |\n| `DEBUG_API_REQUESTS` | set to true so that `uns_mcp/server.py` can output request parameters for better debugging |\n\n\n### Firecrawl Source\n\n[Firecrawl](https://www.firecrawl.dev/) is a web crawling API that provides two main capabilities in our MCP:\n\n1. **HTML Content Retrieval**: Using `invoke_firecrawl_crawlhtml` to start crawl jobs and `check_crawlhtml_status` to monitor them\n2. **LLM-Optimized Text Generation**: Using `invoke_firecrawl_llmtxt` to generate text and `check_llmtxt_status` to retrieve results\n\nHow Firecrawl works:\n\n**Web Crawling Process:**\n- Starts with a specified URL and analyzes it to identify links\n- Uses the sitemap if available; otherwise follows links found on the website\n- Recursively traverses each link to discover all subpages\n- Gathers content from every visited page, handling JavaScript rendering and rate limits\n- Jobs can be cancelled with `cancel_crawlhtml_job` if needed\n- Use this if you require all the info extracted into raw HTML, Unstructured's workflow cleans it up really well :smile:\n\n**LLM Text Generation:**\n- After crawling, extracts clean, meaningful text content from the crawled pages\n- Generates optimized text formats specifically formatted for large language models\n- Results are automatically uploaded to the specified S3 location\n- Note: LLM text generation jobs cannot be cancelled once started. The `cancel_llmtxt_job` function is provided for consistency but is not currently supported by the Firecrawl API.\n\nNote: A `FIRECRAWL_API_KEY` environment variable must be set to use these functions.\n\n## Installation & Configuration\n\nThis guide provides step-by-step instructions to set up and configure the UNS_MCP server using Python 3.12 and the `uv` tool.\n\n## Prerequisites\n- Python 3.12+\n- `uv` for environment management\n- An API key from Unstructured. You can sign up and obtain your API key [here](https://platform.unstructured.io/app/account/api-keys).\n\n### Using `uv` (Recommended)\n\nNo additional installation is required when using `uvx` as it handles execution. However, if you prefer to install the package directly:\n```bash\nuv pip install uns_mcp\n```\n\n#### Configure Claude Desktop\nFor integration with Claude Desktop, add the following content to your `claude_desktop_config.json`:\n\n**Note:** The file is located in the `~/Library/Application Support/Claude/` directory.\n\n**Using `uvx` Command:**\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**Alternatively, Using Python Package:**\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### Using Source Code\n1. Clone the repository.\n\n2. Install dependencies:\n ```bash\n uv sync\n ```\n\n3. Set your Unstructured API key as an environment variable. Create a .env file in the root directory with the following content:\n ````bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ````\n Refer to `.env.template` for the configurable environment variables.\n\nYou can now run the server using one of the following methods:\n\n

\nUsing Editable Package Installation\n

\nInstall as an editable package:\n\n```bash\nuvx pip install -e .\n```\n\nUpdate your Claude Desktop config:\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"]\n }\n }\n}\n```\n**Note**: Remember to point to the uvx executable in environment where you installed the package\n\n

\n\n

\nUsing SSE Server Protocol\n

\n\n**Note: Not supported by Claude Desktop.**\n\nFor SSE protocol, you can debug more easily by decoupling the client and server:\n\n1. Start the server in one terminal:\n ```bash\n uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080\n # or\n make sse-server\n ```\n\n2. Test the server using a local client in another terminal:\n ```bash\n uv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\"\n # or\n make sse-client\n ```\n**Note:** To stop the services, use `Ctrl+C` on the client first, then the server.\n

\n\n

\nUsing Stdio Server Protocol\n

\n\nConfigure Claude Desktop to use stdio:\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"ABSOLUTE/PATH/TO/.local/bin/uv\",\n \"args\": [\n \"--directory\",\n \"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp\",\n \"run\",\n \"server.py\"\n ]\n }\n }\n}\n```\nAlternatively, run the local client:\n```bash\nuv run python minimal_client/client.py uns_mcp/server.py\n```\n

\n\n## Additional Local Client Configuration\nConfigure the minimal client using environmental variables:\n- `LOG_LEVEL=\"ERROR\"`: Set to suppress debug outputs from the LLM, displaying clear messages for users.\n- `CONFIRM_TOOL_USE='false'`: Disable tool use confirmation before execution. **Use with caution**, especially during development, as LLM may execute expensive workflows or delete data.\n\n\n#### Debugging tools\n\nAnthropic provides `MCP Inspector` tool to debug/test your MCP server. Run the following command to spin up a debugging UI. From there, you will be able to add environment variables (pointing to your local env) on the left pane. Include your personal API key there as env var. Go to `tools`, you can test out the capabilities you add to the MCP server.\n```\nmcp dev uns_mcp/server.py\n```\n\nIf you need to log request call parameters to `UnstructuredClient`, set the environment variable `DEBUG_API_REQUESTS=false`.\nThe logs are stored in a file with the format `unstructured-client-{date}.log`, which can be examined to debug request call parameters to `UnstructuredClient` functions.\n\n\n## Add terminal access to minimal client\nWe are going to use [@wonderwhy-er/desktop-commander](https://github.com/wonderwhy-er/DesktopCommanderMCP) to add terminal access to the minimal client. It is built on the MCP Filesystem Server. Be careful, as the client (also LLM) now **has access to private files.**\n\nExecute the following command to install the package:\n```bash\nnpx @wonderwhy-er/desktop-commander setup\n```\n\nThen start client with extra parameter:\n\n```bash\nuv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\" \"@wonderwhy-er/desktop-commander\"\n# or\nmake sse-client-terminal\n```\n\n## Using subset of tools\nIf your client supports using only subset of tools here are the list of things you should be aware:\n- `update_workflow` tool has to be loaded in the context together with `create_workflow` tool, because it contains detailed description on how to create and configure custom node.\n\n## Known issues\n- `update_workflow` - needs to have in context the configuration of the workflow it is updating either by providing it by the user or by calling `get_workflow_info` tool, as this tool doesn't work as `patch` applier, it fully replaces the workflow config.\n\n## CHANGELOG.md\n\nAny new developed features/fixes/enhancements will be added to CHANGELOG.md. 0.x.x-dev pre-release format is preferred before we bump to a stable version.\n\n# Troubleshooting\n- If you encounter issues with `Error: spawn ENOENT` it means `` is not installed or visible in your PATH:\n - Make sure to install it and add it to your PATH.\n - or provide absolute path to the command in the `command` field of your config. So for example replace `python` with `/opt/miniconda3/bin/python`\n","English","en-US",{"_34":53,"_38":57,"_43":58},{"_36":54,"_38":55,"_40":56},"Una implementación de servidor MCP que permite la interacción con la API no estructurada, proporcionando herramientas para enumerar, crear, actualizar y administrar fuentes, destinos y flujos de trabajo.","Servidor MCP de API no estructurada","# Servidor MCP de API no estructurada\n\nImplementación de un servidor MCP para interactuar con la API no estructurada. Este servidor proporciona herramientas para listar fuentes y flujos de trabajo.\n\n## Herramientas disponibles\n\n| Herramienta | Descripción |\n| ------------------------------ | ----------------------------------------------------------------------------------------- |\n| `list_sources` | Enumera las fuentes disponibles de la API no estructurada. |\n| `get_source_info` | Obtenga información detallada sobre un conector de fuente específico. |\n| `create_source_connector` | Crear un conector de origen.) |\n| `update_source_connector` | Actualizar un conector de origen existente mediante parámetros. |\n| `delete_source_connector` | Eliminar un conector de origen por ID de origen. |\n| `list_destinations` | Enumera los destinos disponibles desde la API no estructurada. |\n| `get_destination_info` | Obtenga información detallada sobre un conector de destino específico |\n| `create_destination_connector` | Crear un conector de destino mediante parámetros. |\n| `update_destination_connector` | Actualizar un conector de destino existente por ID de destino. |\n| `delete_destination_connector` | Eliminar un conector de destino por ID de destino. |\n| `list_workflows` | Enumera los flujos de trabajo de la API no estructurada. |\n| `get_workflow_info` | Obtenga información detallada sobre un flujo de trabajo específico. |\n| `create_workflow` | Cree un nuevo flujo de trabajo con identificación de origen, destino, etc. |\n| `run_workflow` | Ejecutar un flujo de trabajo específico con ID de flujo de trabajo |\n| `update_workflow` | Actualizar un flujo de trabajo existente mediante parámetros. |\n| `delete_workflow` | Eliminar un flujo de trabajo específico por id. |\n| `list_jobs` | Enumera trabajos para un flujo de trabajo específico desde la API no estructurada. |\n| `get_job_info` | Obtenga información detallada sobre un trabajo específico por identificación del trabajo. |\n| `cancel_job` | Eliminar un trabajo específico por id. |\n\nA continuación se muestra una lista de los conectores compatibles actualmente con el servidor `UNS-MCP` . Consulte la lista completa de conectores de origen compatibles con la plataforma no estructurada [aquí](https://docs.unstructured.io/api-reference/workflow/sources/overview) y la lista de destinos [aquí](https://docs.unstructured.io/api-reference/workflow/destinations/overview) . ¡Estamos planeando añadir más!\n\n| Fuente | Destino |\n| -------------------- | -------------------------------------- |\n| S3 | S3 |\n| Azur | Tejer |\n| Google Drive | Piña |\n| OneDrive | AstraDB |\n| Fuerza de ventas | MongoDB |\n| Punto de intercambio | Neo4j |\n| | Volúmenes de Databricks |\n| | Tabla delta de volúmenes de Databricks |\n\nPara usar la herramienta que crea, actualiza o elimina un conector, las credenciales de ese conector específico deben estar definidas en el archivo .env. A continuación, se muestra la lista de `credentials` para los conectores compatibles:\n\n| Nombre de la credencial | Descripción |\n| ------------------------------------------------------------------------------------------ | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ |\n| `ANTHROPIC_API_KEY` | necesario para ejecutar `minimal_client` para interactuar con nuestro servidor. |\n| `AWS_KEY` , `AWS_SECRET` | Es necesario crear un conector S3 a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación](https://docs.unstructured.io/api-reference/workflow/sources/s3) y [aquí.](https://docs.unstructured.io/api-reference/workflow/destinations/s3) |\n| `WEAVIATE_CLOUD_API_KEY` | Se requiere crear un conector de base de datos vectorial Weaviate; consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate) |\n| `FIRECRAWL_API_KEY` | necesario para utilizar las herramientas Firecrawl en `external/firecrawl.py` , registrarse en [Firecrawl](https://www.firecrawl.dev/) y obtener una clave API. |\n| `ASTRA_DB_APPLICATION_TOKEN` , PUNTO FINAL DE API `ASTRA_DB_API_ENDPOINT` | Es necesario crear un conector Astradb a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ui/destinations/astradb) |\n| `AZURE_CONNECTION_STRING` | Opción 1 requerida para crear un conector de Azure a través del servidor `uns-mcp` , consulte cómo en [la documentación](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| NOMBRE DE CUENTA `AZURE_ACCOUNT_NAME` + CLAVE `AZURE_ACCOUNT_KEY` CUENTA DE AZURE | Opción 2 requerida para crear un conector de Azure a través del servidor `uns-mcp` , consulte cómo en [la documentación](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| NOMBRE `AZURE_SAS_TOKEN` CUENTA `AZURE_ACCOUNT_NAME` AZURE + TOKEN SAS DE AZURE | Se requiere la opción 3 para crear un conector de Azure a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `NEO4J_PASSWORD` | Es necesario crear un conector Neo4j a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ui/destinations/neo4j) |\n| `MONGO_DB_CONNECTION_STRING` | Es necesario crear un conector Mongodb a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ui/destinations/mongodb) |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | Un valor de cadena. La clave de la cuenta del servidor original (siga [la documentación](https://docs.unstructured.io/ui/sources/google-drive) ) está en un archivo JSON. Ejecute `base64 < /path/to/google_service_account_key.json` en la terminal para obtener el valor de cadena. |\n| `DATABRICKS_CLIENT_ID` , `DATABRICKS_CLIENT_SECRET` | Se requiere crear un conector de tabla delta/volumen de Databricks a través del servidor `uns-mcp` ; consulte cómo hacerlo en [la documentación](https://docs.unstructured.io/ui/destinations/databricks-volumes) y [aquí.](https://docs.unstructured.io/ui/destinations/databricks-delta-table) |\n| ID DE `ONEDRIVE_CLIENT_ID` , `ONEDRIVE_CLIENT_CRED` , ID DE INQUILINO `ONEDRIVE_TENANT_ID` | Es necesario crear un conector de One Drive a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ui/destinations/onedrive) |\n| `PINECONE_API_KEY` | Se requiere crear un conector de base de datos vectorial Pinecone a través del servidor `uns-mcp` ; consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ui/destinations/pinecone) |\n| `SALESFORCE_CONSUMER_KEY` , `SALESFORCE_PRIVATE_KEY` | Es necesario crear un conector de origen de Salesforce a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ingestion/source-connectors/salesforce) |\n| `SHAREPOINT_CLIENT_ID` , `SHAREPOINT_CLIENT_CRED` , `SHAREPOINT_TENANT_ID` | Es necesario crear un conector de One Drive a través del servidor `uns-mcp` . Consulte cómo hacerlo en [la documentación.](https://docs.unstructured.io/ui/sources/sharepoint) |\n| `LOG_LEVEL` | Se utiliza para establecer el nivel de registro para nuestro `minimal_client` , por ejemplo, configúrelo en ERROR para obtener todo |\n| `CONFIRM_TOOL_USE` | Establezca en verdadero para que `minimal_client` pueda confirmar la ejecución antes de cada llamada a la herramienta |\n| `DEBUG_API_REQUESTS` | Establezca en verdadero para que `uns_mcp/server.py` pueda generar parámetros de solicitud para una mejor depuración |\n\n### Fuente de Firecrawl\n\n[Firecrawl](https://www.firecrawl.dev/) es una API de rastreo web que proporciona dos capacidades principales en nuestro MCP:\n\n1. **Recuperación de contenido HTML** : uso de `invoke_firecrawl_crawlhtml` para iniciar trabajos de rastreo y `check_crawlhtml_status` para monitorearlos\n2. **Generación de texto optimizada para LLM** : uso de `invoke_firecrawl_llmtxt` para generar texto y `check_llmtxt_status` para recuperar resultados\n\nCómo funciona Firecrawl:\n\n**Proceso de rastreo web:**\n\n* Comienza con una URL específica y la analiza para identificar enlaces.\n* Utiliza el mapa del sitio si está disponible; de lo contrario, sigue los enlaces que se encuentran en el sitio web.\n* Recorre recursivamente cada enlace para descubrir todas las subpáginas\n* Recopila contenido de cada página visitada, gestionando la representación de JavaScript y los límites de velocidad.\n* Los trabajos se pueden cancelar con `cancel_crawlhtml_job` si es necesario\n* Use esto si necesita toda la información extraída en HTML sin formato, el flujo de trabajo de Unstructured lo limpia muy bien :smile:\n\n**Generación de textos LLM:**\n\n* Después del rastreo, extrae contenido de texto limpio y significativo de las páginas rastreadas.\n* Genera formatos de texto optimizados y formateados específicamente para modelos de lenguaje grandes.\n* Los resultados se cargan automáticamente en la ubicación S3 especificada\n* Nota: Los trabajos de generación de texto LLM no se pueden cancelar una vez iniciados. La función `cancel_llmtxt_job` se proporciona por coherencia, pero actualmente no es compatible con la API de Firecrawl.\n\nNota: Se debe configurar una variable de entorno `FIRECRAWL_API_KEY` para utilizar estas funciones.\n\n## Instalación y configuración\n\nEsta guía proporciona instrucciones paso a paso para configurar el servidor UNS\\_MCP utilizando Python 3.12 y la herramienta `uv` .\n\n## Prerrequisitos\n\n* Python 3.12+\n* `uv` para la gestión ambiental\n* Una clave API de Unstructured. Puedes registrarte y obtener tu clave API [aquí](https://platform.unstructured.io/app/account/api-keys) .\n\n### Uso de `uv` (recomendado)\n\nNo se requiere instalación adicional al usar `uvx` , ya que gestiona la ejecución. Sin embargo, si prefiere instalar el paquete directamente:\n\n```bash\nuv pip install uns_mcp\n```\n\n#### Configurar Claude Desktop\n\nPara la integración con Claude Desktop, agregue el siguiente contenido a su `claude_desktop_config.json` :\n\n**Nota:** El archivo se encuentra en el directorio `~/Library/Application Support/Claude/` .\n\n**Usando el comando `uvx` :**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**Alternativamente, utilizando el paquete Python:**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### Usando el código fuente\n\n1. Clonar el repositorio.\n\n2. Instalar dependencias:\n\n ```bash\n uv sync\n ```\n\n3. Establezca su clave de API no estructurada como variable de entorno. Cree un archivo .env en el directorio raíz con el siguiente contenido:\n\n ```bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ```\n\n Consulte `.env.template` para conocer las variables de entorno configurables.\n\nAhora puede ejecutar el servidor utilizando uno de los siguientes métodos:\n\n```bash\nuvx pip install -e .\n```\n\nActualice la configuración de Claude Desktop:\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"]\n }\n }\n}\n```\n\n**Nota** : Recuerde apuntar al ejecutable uvx en el entorno donde instaló el paquete\n\n**Nota: No compatible con Claude Desktop.**\n\nPara el protocolo SSE, puede depurar más fácilmente desacoplando el cliente y el servidor:\n\n1. Inicie el servidor en una terminal:\n\n ```bash\n uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080\n # or\n make sse-server\n ```\n\n2. Pruebe el servidor usando un cliente local en otra terminal:\n\n ```bash\n uv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\"\n # or\n make sse-client\n ```\n\n**Nota:** Para detener los servicios, utilice `Ctrl+C` primero en el cliente y luego en el servidor.\n\nConfigurar Claude Desktop para utilizar stdio:\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"ABSOLUTE/PATH/TO/.local/bin/uv\",\n \"args\": [\n \"--directory\",\n \"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp\",\n \"run\",\n \"server.py\"\n ]\n }\n }\n}\n```\n\nAlternativamente, ejecute el cliente local:\n\n```bash\nuv run python minimal_client/client.py uns_mcp/server.py\n```\n\n## Configuración adicional de cliente local\n\nConfigure el cliente mínimo utilizando variables ambientales:\n\n* `LOG_LEVEL=\"ERROR\"` : se configura para suprimir las salidas de depuración del LLM y mostrar mensajes claros para los usuarios.\n* `CONFIRM_TOOL_USE='false'` : Desactivar la confirmación del uso de la herramienta antes de la ejecución. **Usar con precaución** , especialmente durante el desarrollo, ya que LLM puede ejecutar flujos de trabajo costosos o eliminar datos.\n\n#### Herramientas de depuración\n\nAnthropic ofrece la herramienta `MCP Inspector` para depurar y probar su servidor MCP. Ejecute el siguiente comando para iniciar una interfaz de depuración. Desde allí, podrá agregar variables de entorno (que apunten a su entorno local) en el panel izquierdo. Incluya su clave API personal como variable de entorno. Vaya a `tools` para probar las funciones que agregue al servidor MCP.\n\n```\nmcp dev uns_mcp/server.py\n```\n\nSi necesita registrar los parámetros de las llamadas de solicitud a `UnstructuredClient` , configure la variable de entorno `DEBUG_API_REQUESTS=false` . Los registros se almacenan en un archivo con el formato `unstructured-client-{date}.log` , que puede examinarse para depurar los parámetros de las llamadas de solicitud a las funciones de `UnstructuredClient` .\n\n## Añadir acceso de terminal al cliente mínimo\n\nUsaremos [@wonderwhy-er/desktop-commander](https://github.com/wonderwhy-er/DesktopCommanderMCP) para añadir acceso a la terminal al cliente mínimo. Está basado en el servidor de sistema de archivos MCP. Tenga cuidado, ya que el cliente (también LLM) ahora **tiene acceso a archivos privados.**\n\nEjecute el siguiente comando para instalar el paquete:\n\n```bash\nnpx @wonderwhy-er/desktop-commander setup\n```\n\nLuego inicie el cliente con el parámetro adicional:\n\n```bash\nuv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\" \"@wonderwhy-er/desktop-commander\"\n# or\nmake sse-client-terminal\n```\n\n## Uso de un subconjunto de herramientas\n\nSi su cliente admite el uso de solo un subconjunto de herramientas, aquí le mostramos una lista de cosas que debe tener en cuenta:\n\n* La herramienta `update_workflow` debe cargarse en el contexto junto con la herramienta `create_workflow` , porque contiene una descripción detallada sobre cómo crear y configurar un nodo personalizado.\n\n## Problemas conocidos\n\n* `update_workflow` - debe tener en contexto la configuración del flujo de trabajo que está actualizando, ya sea proporcionándola por el usuario o llamando a la herramienta `get_workflow_info` , ya que esta herramienta no funciona como aplicador `patch` , reemplaza completamente la configuración del flujo de trabajo.\n\n## REGISTRO DE CAMBIOS.md\n\nCualquier nueva característica/corrección/mejora desarrollada se agregará a CHANGELOG.md. Se prefiere el formato de prelanzamiento 0.xx-dev antes de pasar a una versión estable.\n\n# Solución de problemas\n\n* Si encuentra problemas con `Error: spawn ENOENT` significa que `` no está instalado o no es visible en su RUTA:\n * Asegúrese de instalarlo y agregarlo a su PATH.\n * O bien, proporcione la ruta absoluta del comando en el campo `command` de su configuración. Por ejemplo, reemplace `python` por `/opt/miniconda3/bin/python`","Spanish","es-ES",{"_34":60,"_38":64,"_43":65},{"_36":61,"_38":62,"_40":63},"非構造化 API とのやり取りを可能にし、ソース、宛先、ワークフローを一覧表示、作成、更新、管理するためのツールを提供する MCP サーバー実装。","非構造化API MCPサーバー","# 非構造化API MCPサーバー\n\n非構造化APIと連携するためのMCPサーバー実装。このサーバーは、ソースとワークフローを一覧表示するツールを提供します。\n\n## 利用可能なツール\n\n| 道具 | 説明 |\n| ------------------------------ | --------------------------------- |\n| `list_sources` | 非構造化 API から利用可能なソースを一覧表示します。 |\n| `get_source_info` | 特定のソースコネクタに関する詳細情報を取得します。 |\n| `create_source_connector` | ソースコネクタを作成します。 |\n| `update_source_connector` | パラメータによって既存のソースコネクタを更新します。 |\n| `delete_source_connector` | ソース ID によってソースコネクタを削除します。 |\n| `list_destinations` | 非構造化 API から利用可能な宛先を一覧表示します。 |\n| `get_destination_info` | 特定の宛先コネクタに関する詳細情報を取得する |\n| `create_destination_connector` | パラメータによって宛先コネクタを作成します。 |\n| `update_destination_connector` | 既存の宛先コネクタを宛先 ID で更新します。 |\n| `delete_destination_connector` | 宛先 ID によって宛先コネクタを削除します。 |\n| `list_workflows` | 非構造化 API からのワークフローを一覧表示します。 |\n| `get_workflow_info` | 特定のワークフローに関する詳細情報を取得します。 |\n| `create_workflow` | ソース、宛先 ID などを使用して新しいワークフローを作成します。 |\n| `run_workflow` | ワークフローIDで特定のワークフローを実行する |\n| `update_workflow` | パラメータによって既存のワークフローを更新します。 |\n| `delete_workflow` | ID で特定のワークフローを削除します。 |\n| `list_jobs` | 非構造化 API から特定のワークフローのジョブを一覧表示します。 |\n| `get_job_info` | ジョブ ID によって特定のジョブの詳細情報を取得します。 |\n| `cancel_job` | ID で特定のジョブを削除します。 |\n\n以下は、 `UNS-MCP`サーバーが現在サポートしているコネクタのリストです。Unstructuredプラットフォームがサポートするソースコネクタの完全なリストは[こちら](https://docs.unstructured.io/api-reference/workflow/sources/overview)、宛先コネクタのリストは[こちらで](https://docs.unstructured.io/api-reference/workflow/destinations/overview)ご確認ください。今後、コネクタをさらに追加していく予定です。\n\n| ソース | 行き先 |\n| ---------- | ------------------------- |\n| S3 | S3 |\n| アズール | ウィービエイト |\n| Googleドライブ | 松ぼっくり |\n| ワンドライブ | アストラDB |\n| セールスフォース | モンゴDB |\n| シェアポイント | ネオ4j |\n| | Databricks ボリューム |\n| | Databricks ボリュームデルタテーブル |\n\nコネクタを作成／更新／削除するツールを使用するには、.env ファイルで特定のコネクタの認証情報を定義する必要があります。サポート対象のコネクタの`credentials`のリストは以下のとおりです。\n\n| 資格情報名 | 説明 |\n| -------------------------------------------------------------------------- | ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |\n| `ANTHROPIC_API_KEY` | サーバーと対話するには、 `minimal_client`を実行する必要があります。 |\n| `AWS_KEY` 、 `AWS_SECRET` | `uns-mcp`サーバー経由でS3コネクタを作成する必要があります。方法については、[ドキュメント](https://docs.unstructured.io/api-reference/workflow/sources/s3)と[ここを](https://docs.unstructured.io/api-reference/workflow/destinations/s3)参照してください。 |\n| `WEAVIATE_CLOUD_API_KEY` | WeaviateベクターDBコネクタを作成するために必要です。[ドキュメント](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate)で方法を確認してください。 |\n| `FIRECRAWL_API_KEY` | `external/firecrawl.py`の Firecrawl ツールを使用するには、 [Firecrawl](https://www.firecrawl.dev/)にサインアップして API キーを取得する必要があります。 |\n| `ASTRA_DB_APPLICATION_TOKEN` 、 `ASTRA_DB_API_ENDPOINT` | `uns-mcp`サーバー経由でAstradbコネクタを作成する必要があります。方法については[ドキュメントを](https://docs.unstructured.io/ui/destinations/astradb)参照してください。 |\n| `AZURE_CONNECTION_STRING` | `uns-mcp`サーバー経由で Azure コネクタを作成するにはオプション 1 が必要です。方法については[ドキュメントを](https://docs.unstructured.io/ui/sources/azure-blob-storage)参照してください。 |\n| `AZURE_ACCOUNT_NAME` + `AZURE_ACCOUNT_KEY` | `uns-mcp`サーバー経由で Azure コネクタを作成するにはオプション 2 が必要です。方法については[ドキュメントを](https://docs.unstructured.io/ui/sources/azure-blob-storage)参照してください。 |\n| `AZURE_ACCOUNT_NAME` + `AZURE_SAS_TOKEN` | `uns-mcp`サーバー経由で Azure コネクタを作成するにはオプション 3 が必要です。方法については[ドキュメントを](https://docs.unstructured.io/ui/sources/azure-blob-storage)参照してください。 |\n| `NEO4J_PASSWORD` | `uns-mcp`サーバー経由でNeo4jコネクタを作成する必要があります。方法については[ドキュメントを](https://docs.unstructured.io/ui/destinations/neo4j)参照してください。 |\n| `MONGO_DB_CONNECTION_STRING` | `uns-mcp`サーバー経由でMongodbコネクタを作成する必要があります。方法については[ドキュメントを](https://docs.unstructured.io/ui/destinations/mongodb)参照してください。 |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | 文字列値。元のサーバーアカウントキー（[ドキュメント](https://docs.unstructured.io/ui/sources/google-drive)を参照）はJSONファイルに保存されています。ターミナルで`base64 < /path/to/google_service_account_key.json`を実行して文字列値を取得してください。 |\n| `DATABRICKS_CLIENT_ID` 、 `DATABRICKS_CLIENT_SECRET` | `uns-mcp`サーバー経由でDatabricksボリューム/デルタテーブルコネクタを作成する必要があります。方法については[ドキュメント](https://docs.unstructured.io/ui/destinations/databricks-volumes)と[ここを](https://docs.unstructured.io/ui/destinations/databricks-delta-table)参照してください。 |\n| `ONEDRIVE_CLIENT_ID` 、 `ONEDRIVE_CLIENT_CRED` 、 `ONEDRIVE_TENANT_ID` | `uns-mcp`サーバー経由で One Drive コネクタを作成する必要があります。方法については[ドキュメントを](https://docs.unstructured.io/ui/destinations/onedrive)参照してください。 |\n| `PINECONE_API_KEY` | `uns-mcp`サーバー経由でPineconeベクターDBコネクタを作成する必要があります。方法については[ドキュメントを](https://docs.unstructured.io/ui/destinations/pinecone)参照してください。 |\n| `SALESFORCE_CONSUMER_KEY` 、 `SALESFORCE_PRIVATE_KEY` | `uns-mcp`サーバー経由で Salesforce ソースコネクタを作成する必要があります。方法については[ドキュメントを](https://docs.unstructured.io/ingestion/source-connectors/salesforce)参照してください。 |\n| `SHAREPOINT_CLIENT_ID` 、 `SHAREPOINT_CLIENT_CRED` 、 `SHAREPOINT_TENANT_ID` | `uns-mcp`サーバー経由で One Drive コネクタを作成する必要があります。方法については[ドキュメントを](https://docs.unstructured.io/ui/sources/sharepoint)参照してください。 |\n| `LOG_LEVEL` | `minimal_client`のログレベルを設定するために使用します。例えば、すべてを取得するには ERROR に設定します。 |\n| `CONFIRM_TOOL_USE` | trueに設定すると、 `minimal_client`各ツール呼び出しの前に実行を確認できるようになります。 |\n| `DEBUG_API_REQUESTS` | `uns_mcp/server.py`リクエストパラメータを出力してデバッグを効率化できるように true に設定します |\n\n### ファイアクロールソース\n\n[Firecrawl](https://www.firecrawl.dev/)は、MCP で 2 つの主な機能を提供する Web クロール API です。\n\n1. **HTML コンテンツの取得**: `invoke_firecrawl_crawlhtml`を使用してクロールジョブを開始し、 `check_crawlhtml_status`使用して監視します。\n2. **LLM 最適化テキスト生成**: `invoke_firecrawl_llmtxt`を使用してテキストを生成し、 `check_llmtxt_status`使用して結果を取得します。\n\nFirecrawl の仕組み:\n\n**Web クロールのプロセス:**\n\n* 指定されたURLから開始し、それを分析してリンクを識別します\n* サイトマップが利用可能な場合はそれを使用し、そうでない場合はウェブサイト上のリンクに従います\n* 各リンクを再帰的に走査してすべてのサブページを検出します\n* 訪問したすべてのページからコンテンツを収集し、JavaScript レンダリングとレート制限を処理します。\n* 必要に応じて、 `cancel_crawlhtml_job`でジョブをキャンセルできます。\n* すべての情報を生の HTML に抽出する必要がある場合は、これを使用してください。Unstructured のワークフローにより、非常にきれいにクリーンアップされます :smile:\n\n**LLMテキスト生成:**\n\n* クロール後、クロールしたページからクリーンで意味のあるテキストコンテンツを抽出します\n* 大規模言語モデル向けに特別にフォーマットされた最適化されたテキスト形式を生成します\n* 結果は指定されたS3の場所に自動的にアップロードされます\n* 注: LLMテキスト生成ジョブは、開始後はキャンセルできません。cancel\\_llmtxt\\_job関数は一貫性を`cancel_llmtxt_job`ために提供されていますが、現在Firecrawl APIではサポートされていません。\n\n注意: これらの関数を使用するには、 `FIRECRAWL_API_KEY`環境変数を設定する必要があります。\n\n## インストールと設定\n\nこのガイドでは、Python 3.12 と`uv`ツールを使用して UNS\\_MCP サーバーをセットアップおよび構成するための手順を段階的に説明します。\n\n## 前提条件\n\n* Python 3.12以上\n* 環境管理のための`uv`\n* UnstructuredのAPIキー。[こちらから](https://platform.unstructured.io/app/account/api-keys)サインアップしてAPIキーを取得できます。\n\n### `uv`の使用（推奨）\n\n`uvx`を使用する場合、実行はuvxが行うため、追加のインストールは必要ありません。ただし、パッケージを直接インストールしたい場合は、以下の手順に従ってください。\n\n```bash\nuv pip install uns_mcp\n```\n\n#### Claudeデスクトップの設定\n\nClaude Desktop との統合については、 `claude_desktop_config.json`に次のコンテンツを追加します。\n\n\\*\\*注:\\*\\*ファイルは`~/Library/Application Support/Claude/`ディレクトリにあります。\n\n**`uvx`コマンドの使用:**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**あるいは、Python パッケージを使用する:**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### ソースコードの使用\n\n1. リポジトリをクローンします。\n\n2. 依存関係をインストールします:\n\n ```bash\n uv sync\n ```\n\n3. 非構造化APIキーを環境変数として設定します。ルートディレクトリに以下の内容の.envファイルを作成します。\n\n ```bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ```\n\n 設定可能な環境変数については、 `.env.template`を参照してください。\n\n次のいずれかの方法でサーバーを実行できるようになりました。\n\n```bash\nuvx pip install -e .\n```\n\nClaude Desktop の設定を更新します。\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"]\n }\n }\n}\n```\n\n**注**: パッケージをインストールした環境でuvx実行ファイルを指定することを忘れないでください\n\n**注意: Claude Desktop ではサポートされていません。**\n\nSSE プロトコルの場合、クライアントとサーバーを分離することでデバッグが簡単になります。\n\n1. 1 つのターミナルでサーバーを起動します。\n\n ```bash\n uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080\n # or\n make sse-server\n ```\n\n2. 別のターミナルでローカルクライアントを使用してサーバーをテストします。\n\n ```bash\n uv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\"\n # or\n make sse-client\n ```\n\n\\*\\*注:\\*\\*サービスを停止するには、最初にクライアントで`Ctrl+C`を使用し、次にサーバーで Ctrl+C を使用します。\n\nClaude Desktop を stdio を使用するように設定します。\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"ABSOLUTE/PATH/TO/.local/bin/uv\",\n \"args\": [\n \"--directory\",\n \"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp\",\n \"run\",\n \"server.py\"\n ]\n }\n }\n}\n```\n\nあるいは、ローカルクライアントを実行します。\n\n```bash\nuv run python minimal_client/client.py uns_mcp/server.py\n```\n\n## 追加のローカルクライアント構成\n\n環境変数を使用して最小限のクライアントを構成します。\n\n* `LOG_LEVEL=\"ERROR\"` : LLM からのデバッグ出力を抑制し、ユーザーに明確なメッセージを表示するように設定します。\n* `CONFIRM_TOOL_USE='false'` : 実行前のツール使用確認を無効にします。LLMは高負荷のワークフローを実行したり、データを削除したりする可能性があるため、特に開発中は**注意して使用して**ください。\n\n#### デバッグツール\n\nAnthropicは、MCPサーバーのデバッグ/テストに使用できる`MCP Inspector`ツールを提供��ています。以下のコマンドを実行するとデバッグUIが起動します。そこから、左ペインに環境変数（ローカル環境を指す）を追加できます。環境変数には、ご自身のAPIキーを含めてください。 `tools`に移動すると、MCPサーバーに追加した機能をテストできます。\n\n```\nmcp dev uns_mcp/server.py\n```\n\n`UnstructuredClient`へのリクエスト呼び出しパラメータをログに記録する必要がある場合は、環境変数`DEBUG_API_REQUESTS=false`を設定してください。ログは`unstructured-client-{date}.log`形式のファイルに保存され、 `UnstructuredClient`関数へのリクエスト呼び出しパラメータをデバッグするために使用できます。\n\n## 最小限のクライアントにターミナルアクセスを追加する\n\n[@wonderwhy-er/desktop-commander](https://github.com/wonderwhy-er/DesktopCommanderMCP)を使用して、最小限のクライアントにターミナルアクセスを追加します。これは MCP ファイルシステムサーバー上に構築されています。クライアント（LLM も）**がプライベートファイルにアクセスできるようになるため、ご注意ください。**\n\nパッケージをインストールするには、次のコマンドを実行します。\n\n```bash\nnpx @wonderwhy-er/desktop-commander setup\n```\n\n次に、追加のパラメータを使用してクライアントを起動します。\n\n```bash\nuv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\" \"@wonderwhy-er/desktop-commander\"\n# or\nmake sse-client-terminal\n```\n\n## ツールのサブセットを使用する\n\nクライアントがツールのサブセットのみの使用をサポートしている場合は、次の点に注意してください。\n\n* `update_workflow`ツールには、カスタムノードの作成方法と構成方法に関する詳細な説明が含まれているため、 `create_workflow`ツールと一緒にコンテキストにロードする必要があります。\n\n## 既知の問題\n\n* `update_workflow` - ユーザーが指定するか、 `get_workflow_info`ツールを呼び出すことによって、更新するワークフローの構成をコンテキストに含める必要があります。このツールは`patch`適用ツールとして機能しないため、ワークフロー構成を完全に置き換えます。\n\n## 変更ログ.md\n\n新たに開発された機能/修正/拡張機能はすべて CHANGELOG.md に追加されます。安定バージョンに移行する前に、0.xx-dev プレリリース形式が推奨されます。\n\n# トラブルシューティング\n\n* `Error: spawn ENOENT`問題が発生した場合は、 ``がインストールされていないか、PATH に表示されていないことを意味します。\n * 必ずインストールして PATH に追加してください。\n * または、設定の`command`フィールドにコマンドへの絶対パスを指定します。例えば、 `python``/opt/miniconda3/bin/python`に置き換えます。","Japanese","ja-JP",{"_34":67,"_38":71,"_43":72},{"_36":68,"_38":69,"_40":70},"소스, 대상 및 워크플로를 나열, 생성, 업데이트 및 관리하는 도구를 제공하여 비정형 API와의 상호작용을 가능하게 하는 MCP 서버 구현입니다.","비정형 API MCP 서버","# 비정형 API MCP 서버\n\n비정형 API와 상호 작용하기 위한 MCP 서버 구현입니다. 이 서버는 소스와 워크플로를 나열하는 도구를 제공합니다.\n\n## 사용 가능한 도구\n\n| 도구 | 설명 |\n| ------------------------------ | ------------------------------------ |\n| `list_sources` | Unstructured API에서 사용 가능한 소스를 나열합니다. |\n| `get_source_info` | 특정 소스 커넥터에 대한 자세한 정보를 얻으세요. |\n| `create_source_connector` | 소스 커넥터를 생성합니다.) |\n| `update_source_connector` | 매개변수로 기존 소스 커넥터를 업데이트합니다. |\n| `delete_source_connector` | 소스 ID로 소스 커넥터를 삭제합니다. |\n| `list_destinations` | 비정형 API에서 사용 가능한 목적지를 나열합니다. |\n| `get_destination_info` | 특정 목적지 커넥터에 대한 자세한 정보를 얻으세요 |\n| `create_destination_connector` | 매개변수로 대상 커넥터를 만듭니다. |\n| `update_destination_connector` | 대상 ID로 기존 대상 커넥터를 업데이트합니다. |\n| `delete_destination_connector` | 대상 ID로 대상 커넥터를 삭제합니다. |\n| `list_workflows` | 비정형 API의 워크플로를 나열합니다. |\n| `get_workflow_info` | 특정 워크플로에 대한 자세한 정보를 얻으세요. |\n| `create_workflow` | 소스, 대상 ID 등을 사용하여 새로운 워크플로를 만듭니다. |\n| `run_workflow` | 워크플로 ID로 특정 워크플로 실행 |\n| `update_workflow` | 매개변수로 기존 워크플로를 업데이트합니다. |\n| `delete_workflow` | ID로 특정 워크플로를 삭제합니다. |\n| `list_jobs` | 비정형 API에서 특정 워크플로에 대한 작업을 나열합니다. |\n| `get_job_info` | 직무 ID로 특정 직무에 대한 자세한 정보를 얻으세요. |\n| `cancel_job` | ID로 특정 작업을 삭제합니다. |\n\n아래는 `UNS-MCP` 서버가 현재 지원하는 커넥터 목록입니다. Unstructured 플랫폼에서 지원하는 소스 커넥터의 전체 목록은 [여기에서](https://docs.unstructured.io/api-reference/workflow/sources/overview) , 대상 커넥터 목록은 [여기에서](https://docs.unstructured.io/api-reference/workflow/destinations/overview) 확인하세요. 더 많은 커넥터를 추가할 계획입니다!\n\n| 원천 | 목적지 |\n| ------- | -------------------- |\n| S3 | S3 |\n| 하늘빛 | 위비에이트 |\n| 구글 드라이브 | 솔방울 |\n| 원드라이브 | 아스트라DB |\n| 세일즈포스 | 몽고디비 |\n| 셰어포인트 | 네오4j |\n| | Databricks 볼륨 |\n| | Databricks 볼륨 델타 테이블 |\n\n커넥터를 생성/업데이트/삭제하는 도구를 사용하려면 해당 커넥터의 사용자 인증 정보를 .env 파일에 정의해야 합니다. 아래는 지원되는 커넥터의 `credentials` 목록입니다.\n\n| 자격 증명 이름 | 설명 |\n| -------------------------------------------------------------------------- | --------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |\n| `ANTHROPIC_API_KEY` | 서버와 상호 작용하려면 `minimal_client` 실행해야 합니다. |\n| `AWS_KEY` , `AWS_SECRET` | `uns-mcp` 서버를 통해 S3 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/api-reference/workflow/sources/s3) 와 [여기](https://docs.unstructured.io/api-reference/workflow/destinations/s3) 에서 방법을 확인하세요. |\n| `WEAVIATE_CLOUD_API_KEY` | Weaviate 벡터 DB 커넥터를 생성하는 데 필요한 방법은 [설명서](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate) 를 참조하세요. |\n| `FIRECRAWL_API_KEY` | `external/firecrawl.py` 에 있는 Firecrawl 도구를 사용하려면 [Firecrawl](https://www.firecrawl.dev/) 에 가입하고 API 키를 받아야 합니다. |\n| `ASTRA_DB_APPLICATION_TOKEN` , `ASTRA_DB_API_ENDPOINT` | `uns-mcp` 서버를 통해 Astradb 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ui/destinations/astradb) 를 참조하세요. |\n| `AZURE_CONNECTION_STRING` | `uns-mcp` 서버를 통해 Azure 커넥터를 생성하려면 옵션 1이 필요합니다. 자세한 내용은 [설명서를](https://docs.unstructured.io/ui/sources/azure-blob-storage) 참조하세요. |\n| `AZURE_ACCOUNT_NAME` + `AZURE_ACCOUNT_KEY` | `uns-mcp` 서버를 통해 Azure 커넥터를 생성하려면 옵션 2가 필요합니다. 자세한 내용은 [설명서를](https://docs.unstructured.io/ui/sources/azure-blob-storage) 참조하세요. |\n| `AZURE_ACCOUNT_NAME` + `AZURE_SAS_TOKEN` | `uns-mcp` 서버를 통해 Azure 커넥터를 생성하려면 옵션 3이 필요합니다. 자세한 내용은 [설명서를](https://docs.unstructured.io/ui/sources/azure-blob-storage) 참조하세요. |\n| `NEO4J_PASSWORD` | `uns-mcp` 서버를 통해 Neo4j 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ui/destinations/neo4j) 를 참조하세요. |\n| `MONGO_DB_CONNECTION_STRING` | `uns-mcp` 서버를 통해 Mongodb 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ui/destinations/mongodb) 를 참조하세요. |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | 문자열 값입니다. 원본 서버 계정 키( [문서](https://docs.unstructured.io/ui/sources/google-drive) 참조)는 JSON 파일 형태로 제공됩니다. 터미널에서 `base64 < /path/to/google_service_account_key.json` 명령어를 실행하여 문자열 값을 가져오세요. |\n| `DATABRICKS_CLIENT_ID` , `DATABRICKS_CLIENT_SECRET` | `uns-mcp` 서버를 통해 Databricks 볼륨/델타 테이블 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ui/destinations/databricks-volumes) 와 [여기](https://docs.unstructured.io/ui/destinations/databricks-delta-table) 에서 방법을 확인하세요. |\n| `ONEDRIVE_CLIENT_ID` , `ONEDRIVE_CLIENT_CRED` , `ONEDRIVE_TENANT_ID` | `uns-mcp` 서버를 통해 One Drive 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ui/destinations/onedrive) 에서 방법을 확인하세요. |\n| `PINECONE_API_KEY` | `uns-mcp` 서버를 통해 Pinecone 벡터 DB 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ui/destinations/pinecone) 에서 방법을 확인하세요. |\n| `SALESFORCE_CONSUMER_KEY` , `SALESFORCE_PRIVATE_KEY` | `uns-mcp` 서버를 통해 Salesforce 소스 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ingestion/source-connectors/salesforce) 에서 방법을 확인하세요. |\n| `SHAREPOINT_CLIENT_ID` , `SHAREPOINT_CLIENT_CRED` , `SHAREPOINT_TENANT_ID` | `uns-mcp` 서버를 통해 One Drive 커넥터를 생성해야 합니다. [설명서](https://docs.unstructured.io/ui/sources/sharepoint) 에서 방법을 확인하세요. |\n| `LOG_LEVEL` | `minimal_client` 에 대한 로깅 수준을 설정하는 데 사용됩니다. 예를 들어 모든 것을 가져오려면 ERROR로 설정합니다. |\n| `CONFIRM_TOOL_USE` | `minimal_client` 각 도구 호출 전에 실행을 확인할 수 있도록 true로 설정 |\n| `DEBUG_API_REQUESTS` | `uns_mcp/server.py` 더 나은 디버깅을 위해 요청 매개변수를 출력할 수 있도록 true로 설정 |\n\n### 파이어크롤 소스\n\n[Firecrawl](https://www.firecrawl.dev/) 은 MCP에서 두 가지 주요 기능을 제공하는 웹 크롤링 API입니다.\n\n1. **HTML 콘텐츠 검색** : `invoke_firecrawl_crawlhtml` 사용하여 크롤링 작업을 시작하고 `check_crawlhtml_status` 사용하여 모니터링합니다.\n2. **LLM 최적화된 텍스트 생성** : `invoke_firecrawl_llmtxt` 사용하여 텍스트를 생성하고 `check_llmtxt_status` 사용하여 결과를 검색합니다.\n\nFirecrawl 작동 방식:\n\n**웹 크롤링 프로세스:**\n\n* 지정된 URL로 시작하여 이를 분석하여 링크를 식별합니다.\n* 사이트맵이 있으면 사용하고, 그렇지 않으면 웹사이트에서 찾은 링크를 따릅니다.\n* 각 링크를 재귀적으로 탐색하여 모든 하위 페이지를 발견합니다.\n* 방문한 모든 페이지에서 콘텐츠를 수집하고 JavaScript 렌더링 및 속도 제한을 처리합니다.\n* 필요한 경우 `cancel_crawlhtml_job` 사용하여 작업을 취소할 수 있습니다.\n* 모든 정보를 원시 HTML로 추출해야 하는 경우 이것을 사용하세요. Unstructured의 워크플로가 이를 정말 잘 정리해 줍니다. :smile:\n\n**LLM 텍스트 생성:**\n\n* 크롤링 후 크롤링된 페이지에서 깔끔하고 의미 있는 텍스트 콘텐츠를 추출합니다.\n* 대규모 언어 모델에 맞게 특별히 포맷된 최적화된 텍스트 형식을 생성합니다.\n* 결과는 지정된 S3 위치에 자동으로 업로드됩니다.\n* 참고: LLM 텍스트 생성 작업은 시작된 후에는 취소할 수 없습니다. `cancel_llmtxt_job` 함수는 일관성을 위해 제공되지만, 현재 Firecrawl API에서는 지원되지 않습니다.\n\n참고: 이러한 기능을 사용하려면 `FIRECRAWL_API_KEY` 환경 변수를 설정해야 합니다.\n\n## 설치 및 구성\n\n이 가이드에서는 Python 3.12와 `uv` 도구를 사용하여 UNS\\_MCP 서버를 설정하고 구성하는 단계별 지침을 제공합니다.\n\n## 필수 조건\n\n* 파이썬 3.12+\n* 환경 관리를 위한 `uv`\n* Unstructured의 API 키입니다. [여기에서](https://platform.unstructured.io/app/account/api-keys) 가입하고 API 키를 받으실 수 있습니다.\n\n### `uv` 사용 (추천)\n\n`uvx` 사용하면 실행을 처리하므로 추가 설치가 필요하지 않습니다. 하지만 패키지를 직접 설치하려면 다음을 수행하세요.\n\n지엑스피1\n\n#### Claude Desktop 구성\n\nClaude Desktop과 통합하려면 `claude_desktop_config.json` 에 다음 내용을 추가하세요.\n\n**참고:** 해당 파일은 `~/Library/Application Support/Claude/` 디렉토리에 있습니다.\n\n**`uvx` 명령 사용:**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**또는 Python 패키지를 사용합니다.**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### 소스 코드 사용\n\n1. 저장소를 복제합니다.\n\n2. 종속성 설치:\n\n ```bash\n uv sync\n ```\n\n3. 비정형 API 키를 환경 변수로 설정하세요. 루트 디렉터리에 다음 내용으로 .env 파일을 생성하세요.\n\n ```bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ```\n\n 구성 가능한 환경 변수는 `.env.template` 참조하세요.\n\n이제 다음 방법 중 하나를 사용하여 서버를 실행할 수 있습니다.\n\n```bash\nuvx pip install -e .\n```\n\nClaude Desktop 구성을 업데이트하세요.\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"]\n }\n }\n}\n```\n\n**참고** : 패키지를 설치한 환경에서 uvx 실행 파일을 가리키도록 하세요.\n\n**참고: Claude Desktop에서는 지원되지 않습니다.**\n\nSSE 프로토콜의 경우 클라이언트와 서버를 분리하면 더 쉽게 디버깅할 수 있습니다.\n\n1. 한 터미널에서 서버를 시작합니다.\n\n ```bash\n uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080\n # or\n make sse-server\n ```\n\n2. 다른 터미널에서 로컬 클라이언트를 사용하여 서버를 테스트하세요.\n\n ```bash\n uv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\"\n # or\n make sse-client\n ```\n\n**참고:** 서비스를 중지하려면 먼저 클라이언트에서 `Ctrl+C` 사용한 다음 서버에서 Ctrl+C를 사용하세요.\n\nClaude Desktop을 stdio를 사용하도록 구성합니다.\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"ABSOLUTE/PATH/TO/.local/bin/uv\",\n \"args\": [\n \"--directory\",\n \"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp\",\n \"run\",\n \"server.py\"\n ]\n }\n }\n}\n```\n\n또는 로컬 클라이언트를 실행합니다.\n\n```bash\nuv run python minimal_client/client.py uns_mcp/server.py\n```\n\n## 추가 로컬 클라이언트 구성\n\n환경 변수를 사용하여 최소 클라이언트를 구성합니다.\n\n* `LOG_LEVEL=\"ERROR\"` : LLM에서 디버그 출력을 억제하고 사용자에게 명확한 메시지를 표시합니다.\n* `CONFIRM_TOOL_USE='false'` : 실행 전 도구 사용 확인을 비활성화합니다. 특히 개발 중에는 LLM이 비용이 많이 드는 워크플로를 실행하거나 데이터를 삭제할 수 있으므로 **주의해서 사용해야 합니다** .\n\n#### 디버깅 도구\n\nAnthropic은 MCP 서버를 디버깅/테스트할 수 있는 `MCP Inspector` 도구를 제공합니다. 다음 명령을 실행하여 디버깅 UI를 실행하세요. 그러면 왼쪽 창에 로컬 환경을 가리키는 환경 변수를 추가할 수 있습니다. 개인 API 키를 환경 변수로 입력하세요. `tools` 에서 MCP 서버에 추가한 기능을 테스트해 보세요.\n\n```\nmcp dev uns_mcp/server.py\n```\n\n`UnstructuredClient` 에 요청 호출 매개변수를 로깅해야 하는 경우, 환경 변수 `DEBUG_API_REQUESTS=false` 설정하세요. 로그는 `unstructured-client-{date}.log` 형식의 파일에 저장되며, 이 파일을 검토하여 `UnstructuredClient` 함수에 대한 요청 호출 매개변수를 디버깅할 수 있습니다.\n\n## 최소 클라이언트에 터미널 액세스 추가\n\n[@wonderwhy-er/desktop-commander를](https://github.com/wonderwhy-er/DesktopCommanderMCP) 사용하여 최소 클라이언트에 터미널 접근 권한을 추가하겠습니다. 이 클라이언트는 MCP 파일 시스템 서버를 기반으로 합니다. 클라이언트(LLM 포함)가 이제 **개인 파일에 접근할 수 있으므로 주의하십시오.**\n\n다음 명령을 실행하여 패키지를 설치하세요.\n\n```bash\nnpx @wonderwhy-er/desktop-commander setup\n```\n\n그런 다음 추가 매개변수로 클라이언트를 시작합니다.\n\n```bash\nuv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\" \"@wonderwhy-er/desktop-commander\"\n# or\nmake sse-client-terminal\n```\n\n## 도구 하위 집합 사용\n\n클라이언트가 다음 도구의 하위 집합만 사용하는 것을 지원하는 경우 알아야 할 사항은 다음과 같습니다.\n\n* `update_workflow` 도구는 사용자 정의 노드를 만들고 구성하는 방법에 대한 자세한 설명을 포함하고 있으므로 `create_workflow` 도구와 함께 컨텍스트에 로드해야 합니다.\n\n## 알려진 문제\n\n* `update_workflow` - 사용자가 제공하거나 `get_workflow_info` 도구를 호출하여 업데이트하려는 워크플로 구성을 컨텍스트에 포함해야 합니다. 이 도구는 `patch` 적용 도구로 작동하지 않고 워크플로 구성을 완전히 대체합니다.\n\n## 변경 로그.md\n\n새로 개발된 기능/수정/향상 사항은 CHANGELOG.md에 추가됩니다. 안정적인 버전으로 전환하기 전에는 0.xx-dev 사전 릴리스 형식을 사용하는 것이 좋습니다.\n\n# 문제 해결\n\n* `Error: spawn ENOENT` 문제가 발생하는 경우 `` 가 설치되지 않았거나 PATH에 표시되지 않는다는 의미입니다.\n * 꼭 설치하고 PATH에 추가하세요.\n * 또는 설정의 `command` 필드에 명령의 절대 경로를 입력하세요. 예를 들어 `python``/opt/miniconda3/bin/python` 으로 바꾸세요.","Korean","ko-KR",{"_34":74,"_38":78,"_43":79},{"_36":75,"_38":76,"_40":77},"Реализация сервера MCP, которая обеспечивает взаимодействие с неструктурированным API, предоставляя инструменты для составления списка, создания, обновления и управления источниками, пунктами назначения и рабочими процессами.","Неструктурированный API MCP-сервер","# Неструктурированный API MCP-сервер\n\nРеализация сервера MCP для взаимодействия с неструктурированным API. Этот сервер предоставляет инструменты для составления списка источников и рабочих процессов.\n\n## Доступные инструменты\n\n| Инструмент | Описание |\n| ----------------------------------- | ------------------------------------------------------------------------------------------------------------------ |\n| `list_sources` | Перечисляет доступные источники из неструктурированного API. |\n| `get_source_info` | Получите подробную информацию о конкретном исходном соединителе. |\n| `create_source_connector` | Создайте исходный соединитель.) |\n| `update_source_connector` | Обновить существующий исходный коннектор по параметрам. |\n| `delete_source_connector` | Удалить исходный соединитель по идентификатору источника. |\n| `list_destinations` | Список доступных пунктов назначения из неструктурированного API. |\n| `get_destination_info` | Получите подробную информацию о конкретном целевом соединителе |\n| `create_destination_connector` | Создайте коннектор назначения по параметрам. |\n| `update_destination_connector` | Обновите существующий коннектор назначения по идентификатору назначения. |\n| `delete_destination_connector` | Удалить коннектор назначения по идентификатору назначения. |\n| `list_workflows` | Перечисляет рабочие процессы из неструктурированного API. |\n| `get_workflow_info` | Получите подробную информацию о конкретном рабочем процессе. |\n| `create_workflow` | Создайте новый рабочий процесс с идентификатором источника, назначения и т. д. |\n| `run_workflow` | Запустить определенный рабочий процесс с идентификатором рабочего процесса |\n| `update_workflow` | Обновить существующий рабочий процесс по параметрам. |\n| `delete_workflow` | Удалить определенный рабочий процесс по идентификатору. |\n| `list_jobs` | Перечисляет задания для определенного рабочего процесса из неструктурированного API. |\n| `get_job_info` | Получите подробную информацию о конкретной вакансии по ее идентификатору. |\n| `cancel_job` | Удалить конкретную работу по идентификатору. |\n| `list_workflows_with_finished_jobs` | Перечисляет все рабочие процессы, имеющие завершенные задания, а также информацию об источнике и месте назначения. |\n\nНиже приведен список коннекторов, которые в настоящее время поддерживает сервер `UNS-MCP` . Полный список исходных коннекторов, которые поддерживает неструктурированная платформа, см [. здесь](https://docs.unstructured.io/api-reference/workflow/sources/overview) , а список коннекторов назначения [— здесь](https://docs.unstructured.io/api-reference/workflow/destinations/overview) . Мы планируем добавить еще!\n\n| Источник | Место назначения |\n| ----------- | ------------------------------- |\n| С3 | С3 |\n| Лазурный | Weaviate |\n| Google Диск | Шишка |\n| OneDrive | АстраДБ |\n| Salesforce | MongoDB |\n| Sharepoint | Neo4j |\n| | Объемы блоков данных |\n| | Таблица дельта томов Databricks |\n\nЧтобы использовать инструмент, который создает/обновляет/удаляет коннектор, учетные данные для этого конкретного коннектора должны быть определены в вашем файле .env. Ниже приведен список `credentials` для поддерживаемых нами коннекторов:\n\n| Имя удостоверения | Описание |\n| -------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------ |\n| `ANTHROPIC_API_KEY` | требуется запустить `minimal_client` для взаимодействия с нашим сервером. |\n| `AWS_KEY` , `AWS_SECRET` | требуется создать коннектор S3 через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/api-reference/workflow/sources/s3) и [здесь](https://docs.unstructured.io/api-reference/workflow/destinations/s3) |\n| `WEAVIATE_CLOUD_API_KEY` | требуется создать векторный коннектор базы данных Weaviate, см. как это сделать в [документации](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate) |\n| `FIRECRAWL_API_KEY` | для использования инструментов Firecrawl в `external/firecrawl.py` необходимо зарегистрироваться в [Firecrawl](https://www.firecrawl.dev/) и получить ключ API. |\n| `ASTRA_DB_APPLICATION_TOKEN` , `ASTRA_DB_API_ENDPOINT` | требуется создать коннектор Astradb через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/destinations/astradb) |\n| `AZURE_CONNECTION_STRING` | требуется опция 1 для создания Azure Connector через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME` + `AZURE_ACCOUNT_KEY` | требуется вариант 2 для создания коннектора Azure через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME` + `AZURE_SAS_TOKEN` | требуется опция 3 для создания Azure Connector через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `NEO4J_PASSWORD` | требуется создать коннектор Neo4j через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/destinations/neo4j) |\n| `MONGO_DB_CONNECTION_STRING` | требуется создать коннектор MongoDB через сервер `uns-mcp` , см. как ��то сделать в [документации](https://docs.unstructured.io/ui/destinations/mongodb) |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | строковое значение. Исходный ключ учетной записи сервера (следуйте [документации](https://docs.unstructured.io/ui/sources/google-drive) ) находится в файле json, запустите `base64 < /path/to/google_service_account_key.json` в терминале, чтобы получить строковое значение |\n| `DATABRICKS_CLIENT_ID` , `DATABRICKS_CLIENT_SECRET` | требуется создать коннектор таблицы томов/дельта Databricks через сервер `uns-mcp` , см. как в [документации](https://docs.unstructured.io/ui/destinations/databricks-volumes) и [здесь](https://docs.unstructured.io/ui/destinations/databricks-delta-table) |\n| `ONEDRIVE_CLIENT_ID` , `ONEDRIVE_CLIENT_CRED` , `ONEDRIVE_TENANT_ID` | требуется создать коннектор One Drive через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/destinations/onedrive) |\n| `PINECONE_API_KEY` | требуется создать коннектор базы данных Pinecone vector DB через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/destinations/pinecone) |\n| `SALESFORCE_CONSUMER_KEY` , `SALESFORCE_PRIVATE_KEY` | требуется создать исходный коннектор salesforce через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ingestion/source-connectors/salesforce) |\n| `SHAREPOINT_CLIENT_ID` , `SHAREPOINT_CLIENT_CRED` , `SHAREPOINT_TENANT_ID` | требуется создать коннектор One Drive через сервер `uns-mcp` , см. как это сделать в [документации](https://docs.unstructured.io/ui/sources/sharepoint) |\n| `LOG_LEVEL` | Используется для установки уровня ведения журнала для нашего `minimal_client` , например, установите значение ERROR, чтобы получить все |\n| `CONFIRM_TOOL_USE` | установите значение true, чтобы `minimal_client` мог подтвердить выполнение перед каждым вызовом инструмента |\n| `DEBUG_API_REQUESTS` | установите значение true, чтобы `uns_mcp/server.py` мог выводить параметры запроса для лучшей отладки |\n\n### Источник Firecrawl\n\n[Firecrawl](https://www.firecrawl.dev/) — это API веб-сканирования, который предоставляет две основные возможности в нашем MCP:\n\n1. **Извлечение HTML-контента** : использование `invoke_firecrawl_crawlhtml` для запуска заданий сканирования и `check_crawlhtml_status` для их мониторинга\n2. **Генерация текста, оптимизированного для LLM** : использование `invoke_firecrawl_llmtxt` для генерации текста и `check_llmtxt_status` для получения результатов\n\nКак работает Firecrawl:\n\n**Процесс сканирования веб-страниц:**\n\n* Начинает с указанного URL-адреса и анализирует его для выявления ссылок\n* Использует карту сайта, если она доступна; в противном случае переходит по ссылкам, найденным на сайте.\n* Рекурсивно обходит каждую ссылку, чтобы обнаружить все подстраницы.\n* Собирает контент с каждой посещенной страницы, обрабатывает рендеринг JavaScript и ограничения скорости\n* При необходимости задания можно отменить с помощью `cancel_crawlhtml_job`\n* Используйте это, если вам нужно извлечь всю информацию в необработанный HTML. Рабочий процесс Unstructured отлично справляется с этой задачей :smile:\n\n**Генерация текста LLM:**\n\n* После сканирования извлекает чистый, осмысленный текстовый контент из просканированных страниц.\n* Создает оптимизированные текстовые форматы, специально отформатированные для больших языковых моделей.\n* Результаты автоматически загружаются в указанное место S3.\n* Примечание: задания по генерации текста LLM нельзя отменить после запуска. Функция `cancel_llmtxt_job` предусмотрена для обеспечения согласованности, но в настоящее время не поддерживается API Firecrawl.\n\nПримечание: для использования этих функций необходимо установить переменную среды `FIRECRAWL_API_KEY` .\n\n## Установка и настройка\n\nВ этом руководстве приведены пошаговые инструкции по настройке и конфигурированию сервера UNS\\_MCP с использованием Python 3.12 и инструмента `uv` .\n\n## Предпосылки\n\n* Питон 3.12+\n* `uv` для управления окружающей средой\n* Ключ API от Unstructured. Вы можете зарегистрироваться и получить свой ключ API [здесь](https://platform.unstructured.io/app/account/api-keys) .\n\n### Использование `uv` (рекомендуется)\n\nПри использовании `uvx` не требуется дополнительная установка, так как он обрабатывает выполнение. Однако, если вы предпочитаете установить пакет напрямую:\n\n```bash\nuv pip install uns_mcp\n```\n\n#### Настроить рабочий стол Клода\n\nДля интеграции с Claude Desktop добавьте следующий контент в ваш `claude_desktop_config.json` :\n\n**Примечание:** файл находится в каталоге `~/Library/Application Support/Claude/` .\n\n**Использование команды `uvx` :**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**Альтернативный вариант — использование пакета Python:**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### Использование исходного кода\n\n1. Клонируйте репозиторий.\n\n2. Установить зависимости:\n\n ```bash\n uv sync\n ```\n\n3. Установите свой неструктурированный ключ API как переменную среды. Создайте файл .env в корневом каталоге со следующим содержимым:\n\n ```bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ```\n\n Настраиваемые переменные среды см. в `.env.template` .\n\nТеперь вы можете запустить сервер одним из следующих способов:\n\n```bash\nuvx pip install -e .\n```\n\nОбновите конфигурацию Claude Desktop:\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"]\n }\n }\n}\n```\n\n**Примечание** : не забудьте указать исполняемый файл uvx в среде, где вы установили пакет.\n\n**Примечание: не поддерживается Claude Desktop.**\n\nДля протокола SSE отладку можно упростить, разделив клиент и сервер:\n\n1. Запустите сервер в одном терминале:\n\n ```bash\n uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080\n # or\n make sse-server\n ```\n\n2. Протестируйте сервер, используя локальный клиент в другом терминале:\n\n ```bash\n uv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\"\n # or\n make sse-client\n ```\n\n**Примечание:** Чтобы остановить службы, сначала нажмите `Ctrl+C` на клиенте, а затем на сервере.\n\nНастройте Claude Desktop для использования stdio:\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"ABSOLUTE/PATH/TO/.local/bin/uv\",\n \"args\": [\n \"--directory\",\n \"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp\",\n \"run\",\n \"server.py\"\n ]\n }\n }\n}\n```\n\nЛибо запустите локальный клиент:\n\n```bash\nuv run python minimal_client/client.py uns_mcp/server.py\n```\n\n## Дополнительная конфигурация локального клиента\n\nНастройте минимальный клиент с использованием переменных окружения:\n\n* `LOG_LEVEL=\"ERROR\"` : установите для подавления отладочных выходных данных LLM, отображая понятные сообщения для пользователей.\n* `CONFIRM_TOOL_USE='false'` : Отключить подтверждение использования инструмента перед выполнением. **Используйте с осторожностью** , особенно во время разработки, так как LLM может выполнять дорогостоящие рабочие процессы или удалять данные.\n\n#### Инструменты отладки\n\nAnthropic предоставляет инструмент `MCP Inspector` для отладки/тестирования вашего сервера MCP. Выполните следующую команду, чтобы запустить отладочный пользовательский интерфейс. Оттуда вы сможете добавлять переменные среды (указывающие на ваш локальный env) на левой панели. Включите туда свой личный ключ API как env var. Перейдите в `tools` , чтобы протестировать возможности, которые вы добавляете на сервер MCP.\n\n```\nmcp dev uns_mcp/server.py\n```\n\nЕсли вам необходимо регистрировать параметры вызова запроса в `UnstructuredClient` , установите переменную среды `DEBUG_API_REQUESTS=false` . Журналы хранятся в файле формата `unstructured-client-{date}.log` , который можно просмотреть для отладки параметров вызова запроса в функциях `UnstructuredClient` .\n\n## Добавить терминальный доступ к минимальному клиенту\n\nМы собираемся использовать [@wonderwhy-er/desktop-commander](https://github.com/wonderwhy-er/DesktopCommanderMCP) для добавления терминального доступа к минимальному клиенту. Он построен на сервере файловой системы MCP. Будьте осторожны, так как клиент (также LLM) теперь **имеет доступ к приватным файлам.**\n\nДля установки пакета выполните следующую команду:\n\n```bash\nnpx @wonderwhy-er/desktop-commander setup\n```\n\nЗатем запустите клиент с дополнительным параметром:\n\n```bash\nuv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\" \"@wonderwhy-er/desktop-commander\"\n# or\nmake sse-client-terminal\n```\n\n## Использование подмножества инструментов\n\nЕсли ваш клиент поддерживает использование только подмножества инструментов, вот список вещей, которые вам следует знать:\n\n* Инструмент `update_workflow` необходимо загрузить в контексте вместе с инструментом `create_workflow` , поскольку он содержит подробное описание того, как создать и настроить пользовательский узел.\n\n## Известные проблемы\n\n* `update_workflow` — необходимо иметь в контексте конфигурацию обновляемого рабочего процесса, либо предоставив ее пользователю, либо вызвав инструмент `get_workflow_info` , поскольку этот инструмент не работает как средство применения `patch` , он полностью заменяет конфигурацию рабочего процесса.\n\n## CHANGELOG.md\n\nВсе новые разработанные функции/исправления/улучшения будут добавлены в CHANGELOG.md. Предпочтительным является предварительный формат 0.xx-dev, прежде чем мы перейдем к стабильной версии.\n\n# Поиск неисправностей\n\n* Если вы столкнулись с проблемой `Error: spawn ENOENT` это означает, что `` не установлен или не виден в вашем PATH:\n * Обязательно установите его и добавьте в PATH.\n * или укажите абсолютный путь к команде в поле `command` вашего конфига. Например, замените `python` на `/opt/miniconda3/bin/python`","Russian","ru-RU",{"_34":81,"_38":85,"_43":86},{"_36":82,"_38":83,"_40":84},"MCP 服务器实现可与非结构化 API 进行交互，提供列出、创建、更新和管理源、目标和工作流的工具。","非结构化 API MCP 服务器","# 非结构化 API MCP 服务器\n\n用于与非结构化 API 交互的 MCP 服务器实现。该服务器提供列出源和工作流的工具。\n\n## 可用工具\n\n| 工具 | 描述 |\n| ------------------------------ | --------------------- |\n| `list_sources` | 列出非结构化 API 中可用的来源。 |\n| `get_source_info` | 获取有关特定源连接器的详细信息。 |\n| `create_source_connector` | 创建源连接器。） |\n| `update_source_connector` | 通过参数更新现有的源连接器。 |\n| `delete_source_connector` | 通过源 ID 删除源连接器。 |\n| `list_destinations` | 列出非结构化 API 中可用的目的地。 |\n| `get_destination_info` | 获取有关特定目标连接器的详细信息 |\n| `create_destination_connector` | 通过参数创建目标连接器。 |\n| `update_destination_connector` | 通过目标 ID 更新现有的目标连接器。 |\n| `delete_destination_connector` | 根据目标 ID 删除目标连接器。 |\n| `list_workflows` | 列出来自非结构化 API 的工作流程。 |\n| `get_workflow_info` | 获取有关特定工作流程的详细信息。 |\n| `create_workflow` | 创建具有源、目标 ID 等的新工作流。 |\n| `run_workflow` | 运行具有工作流 ID 的特定工作流 |\n| `update_workflow` | 通过参数更新现有的工作流程。 |\n| `delete_workflow` | 根据 ID 删除特定工作流。 |\n| `list_jobs` | 列出非结构化 API 中特定工作流的作业。 |\n| `get_job_info` | 通过作业 ID 获取特定作业的详细信息。 |\n| `cancel_job` | 根据 ID 删除特定作业。 |\n\n以下是`UNS-MCP`服务器当前支持的连接器列表，请点击[此处](https://docs.unstructured.io/api-reference/workflow/sources/overview)查看非结构化平台支持的源连接器完整列表，并[点击此处](https://docs.unstructured.io/api-reference/workflow/destinations/overview)查看目标连接器列表。我们计划添加更多连接器！\n\n| 来源 | 目的地 |\n| ----------- | --------------- |\n| S3 | S3 |\n| Azure | 威维特 |\n| Google 云端硬盘 | 松果 |\n| OneDrive | 阿斯特拉数据库 |\n| Salesforce | MongoDB |\n| SharePoint | Neo4j |\n| | Databricks 卷 |\n| | Databricks 卷增量表 |\n\n要使用创建/更新/删除连接器的工具，必须在 .env 文件中定义该连接器的凭据。以下是我们支持的连接器的`credentials`列表：\n\n| 凭证名称 | 描述 |\n| -------------------------------------------------------------------------- | ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- |\n| `ANTHROPIC_API_KEY` | 需要运行`minimal_client`来与我们的服务器交互。 |\n| `AWS_KEY`和`AWS_SECRET` | 需要通过`uns-mcp`服务器创建 S3 连接器，请参阅[文档](https://docs.unstructured.io/api-reference/workflow/sources/s3)和[此处](https://docs.unstructured.io/api-reference/workflow/destinations/s3)了解如何操作 |\n| `WEAVIATE_CLOUD_API_KEY` | 需要创建 Weaviate 向量数据库连接器，请参阅[文档](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate)中的方法 |\n| `FIRECRAWL_API_KEY` | 需要在`external/firecrawl.py`中使用 Firecrawl 工具，在[Firecrawl](https://www.firecrawl.dev/)上注册并获取 API 密钥。 |\n| `ASTRA_DB_APPLICATION_TOKEN` `ASTRA_DB_API_ENDPOINT` | 需要通过`uns-mcp`服务器创建 Astradb 连接器，请参阅[文档](https://docs.unstructured.io/ui/destinations/astradb)中的方法 |\n| `AZURE_CONNECTION_STRING` | 需要选项 1 通过`uns-mcp`服务器创建 Azure 连接器，请参阅[文档](https://docs.unstructured.io/ui/sources/azure-blob-storage)中的方法 |\n| `AZURE_ACCOUNT_NAME` + `AZURE_ACCOUNT_KEY` | 需要选项 2 通过`uns-mcp`服务器创建 Azure 连接器，请参阅[文档](https://docs.unstructured.io/ui/sources/azure-blob-storage)中的方法 |\n| `AZURE_ACCOUNT_NAME` + `AZURE_SAS_TOKEN` | 需要选项 3 来通过`uns-mcp`服务器创建 Azure 连接器，请参阅[文档](https://docs.unstructured.io/ui/sources/azure-blob-storage)中的方法 |\n| `NEO4J_PASSWORD` | 需要通过`uns-mcp`服务器创建 Neo4j 连接器，请参阅[文档](https://docs.unstructured.io/ui/destinations/neo4j)中的方法 |\n| `MONGO_DB_CONNECTION_STRING` | 需要通过`uns-mcp`服务器创建 Mongodb 连接器，请参阅[文档](https://docs.unstructured.io/ui/destinations/mongodb)中的方法 |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | 字符串值。原始服务器帐户密钥（请参阅[文档](https://docs.unstructured.io/ui/sources/google-drive)）位于 json 文件中，请在终端中运行`base64 < /path/to/google_service_account_key.json`以获取字符串值 |\n| `DATABRICKS_CLIENT_ID`和`DATABRICKS_CLIENT_SECRET` | 需要通过`uns-mcp`服务器创建 Databricks 卷/增量表连接器，请参阅[文档](https://docs.unstructured.io/ui/destinations/databricks-volumes)和[此处](https://docs.unstructured.io/ui/destinations/databricks-delta-table)了解如何操作 |\n| `ONEDRIVE_CLIENT_ID` 、 `ONEDRIVE_CLIENT_CRED` 、 `ONEDRIVE_TENANT_ID` | 需要通过`uns-mcp`服务器创建 One Drive 连接器，请参阅[文档](https://docs.unstructured.io/ui/destinations/onedrive)中的方法 |\n| `PINECONE_API_KEY` | 需要通过`uns-mcp`服务器创建 Pinecone 矢量 DB 连接器，请参阅[文档](https://docs.unstructured.io/ui/destinations/pinecone)中的方法 |\n| `SALESFORCE_CONSUMER_KEY` 、 `SALESFORCE_PRIVATE_KEY` | 需要通过`uns-mcp`服务器创建 salesforce 源连接器，请参阅[文档](https://docs.unstructured.io/ingestion/source-connectors/salesforce)中的方法 |\n| `SHAREPOINT_CLIENT_ID` 、 `SHAREPOINT_CLIENT_CRED` 、 `SHAREPOINT_TENANT_ID` | 需要通过`uns-mcp`服务器创建 One Drive 连接器，请参阅[文档](https://docs.unstructured.io/ui/sources/sharepoint)中的方法 |\n| `LOG_LEVEL` | 用于设置`minimal_client`的日志记录级别，例如设置为 ERROR 以获取所有内容 |\n| `CONFIRM_TOOL_USE` | 设置为 true，以便`minimal_client`可以在每次工具调用之前确认执行 |\n| `DEBUG_API_REQUESTS` | 设置为 true 以便`uns_mcp/server.py`可以输出请求参数以便更好地调试 |\n\n### Firecrawl 源\n\n[Firecrawl](https://www.firecrawl.dev/)是一个 Web 爬取 API，它在我们的 MCP 中提供两项主要功能：\n\n1. **HTML 内容检索**：使用`invoke_firecrawl_crawlhtml`启动抓取作业并使用`check_crawlhtml_status`进行监控\n2. **LLM 优化文本生成**：使用`invoke_firecrawl_llmtxt`生成文本，使用`check_llmtxt_status`检索结果\n\nFirecrawl 的工作原理：\n\n**Web爬取过程：**\n\n* 从指定的 URL 开始并分析它以识别链接\n* 如果可用，则使用站点地图；否则，遵循网站上的链接\n* 递归遍历每个链接以发现所有子页面\n* 收集每个访问页面的内容，处理 JavaScript 渲染和速率限制\n* 如果需要，可以使用`cancel_crawlhtml_job`取消作业\n* 如果您需要将所有信息提取到原始 HTML 中，请使用此功能，Unstructured 的工作流程可以很好地清理它：微笑：\n\n**LLM 文本生成：**\n\n* 爬取完成后，从爬取的页面中提取干净、有意义的文本内容\n* 生成专门针对大型语言模型格式化的优化文本格式\n* 结果自动上传到指定的 S3 位置\n* 注意：LLM 文本生成作业一旦启动便无法取消。cancel\\_llmtxt\\_job 函数是为了保持一致性而提供`cancel_llmtxt_job` ，但目前 Firecrawl API 尚不支持该函数。\n\n注意：必须设置`FIRECRAWL_API_KEY`环境变量才能使用这些功能。\n\n## 安装和配置\n\n本指南提供了使用 Python 3.12 和`uv`工具设置和配置 UNS\\_MCP 服务器的分步说明。\n\n## 先决条件\n\n* Python 3.12+\n* `uv`用于环境管理\n* 来自 Unstructured 的 API 密钥。您可以[在此处](https://platform.unstructured.io/app/account/api-keys)注册并获取您的 API 密钥。\n\n### 使用`uv` （推荐）\n\n使用`uvx`时无需额外安装，因为它会处理执行。但是，如果您希望直接安装软件包：\n\n```bash\nuv pip install uns_mcp\n```\n\n#### 配置 Claude 桌面\n\n为了与 Claude Desktop 集成，请将以下内容添加到您的`claude_desktop_config.json`中：\n\n\\*\\*注意：\\*\\*该文件位于`~/Library/Application Support/Claude/`目录中。\n\n**使用`uvx`命令：**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**或者，使用 Python 包：**\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### 使用源代码\n\n1. 克隆存储库。\n\n2. 安装依赖项：\n\n ```bash\n uv sync\n ```\n\n3. 将您的非结构化 API 密钥设置为环境变量。在根目录中创建一个 .env 文件，其中包含以下内容：\n\n ```bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ```\n\n 请参阅`.env.template`了解可配置的环境变量。\n\n您现在可以使用以下方法之一运行服务器：\n\n```bash\nuvx pip install -e .\n```\n\n更新您的 Claude 桌面配置：\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"]\n }\n }\n}\n```\n\n**注意**：请记住指向安装包的环境中 uvx 可执行文件\n\n**注意：Claude Desktop 不支持。**\n\n对于SSE协议，可以通过解耦客户端和服务器来更轻松地进行调试：\n\n1. 在一个终端中启动服务器：\n\n ```bash\n uv run python uns_mcp/server.py --host 127.0.0.1 --port 8080\n # or\n make sse-server\n ```\n\n2. 在另一个终端中使用本地客户端测试服务器：\n\n ```bash\n uv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\"\n # or\n make sse-client\n ```\n\n\\*\\*注意：\\*\\*要停止服务，请先在客户端上使用`Ctrl+C` ，然后在服务器上使用。\n\n配置 Claude Desktop 以使用 stdio：\n\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"ABSOLUTE/PATH/TO/.local/bin/uv\",\n \"args\": [\n \"--directory\",\n \"ABSOLUTE/PATH/TO/YOUR-UNS-MCP-REPO/uns_mcp\",\n \"run\",\n \"server.py\"\n ]\n }\n }\n}\n```\n\n或者，运行本地客户端：\n\n```bash\nuv run python minimal_client/client.py uns_mcp/server.py\n```\n\n## 附加本地客户端配置\n\n使用环境变量配置最小客户端：\n\n* `LOG_LEVEL=\"ERROR\"` ：设置为抑制来自 LLM 的调试输出，为用户显示清晰的消息。\n* `CONFIRM_TOOL_USE='false'` ：执行前禁用工具使用确认。**请谨慎使用**，尤其是在开发期间，因为 LLM 可能会执行昂贵的工作流程或删除数据。\n\n#### 调试工具\n\nAnthropic 提供了`MCP Inspector`工具来调试/测试您的 MCP 服务器。运行以下命令即可启动调试 UI。之后，您可以在左侧窗格中添加环境变量（指向您的本地环境变量）。并将您的个人 API 密钥作为环境变量添加到其中。前往`tools` ，您可以测试添加到 MCP 服务器的功能。\n\n```\nmcp dev uns_mcp/server.py\n```\n\n如果需要将请求调用参数记录到`UnstructuredClient` ，请设置环境变量`DEBUG_API_REQUESTS=false` 。日志存储在`unstructured-client-{date}.log`格式的文件中，可以检查该文件以调试`UnstructuredClient`函数的请求调用参数。\n\n## 为最小客户端添加终端访问\n\n我们将使用[@wonderwhy-er/desktop-commander](https://github.com/wonderwhy-er/DesktopCommanderMCP)为精简客户端添加终端访问权限。它基于 MCP 文件系统服务器构建。请注意，客户端（也是 LLM）现在**可以访问私有文件。**\n\n执行以下命令来安装该包：\n\n```bash\nnpx @wonderwhy-er/desktop-commander setup\n```\n\n然后使用额外的参数启动客户端：\n\n```bash\nuv run python minimal_client/client.py \"http://127.0.0.1:8080/sse\" \"@wonderwhy-er/desktop-commander\"\n# or\nmake sse-client-terminal\n```\n\n## 使用工具子集\n\n如果您的客户端仅支持使用部分工具，则您应该注意以下事项：\n\n* `update_workflow`工具必须与`create_workflow`工具一起在上下文中加载，因为它包含有关如何创建和配置自定义节点的详细描述。\n\n## 已知问题\n\n* `update_workflow` - 需要在上下文中具有正在更新的工作流的配置，可以通过用户提供或调用`get_workflow_info`工具来实现，因为该工具不能用作`patch`应用程序，它完全取代了工作流配置。\n\n## 变更日志.md\n\n任何新开发的功能/修复/增强功能都将添加到 CHANGELOG.md。在我们发布稳定版本之前，最好使用 0.xx-dev 预发布格式。\n\n# 故障排除\n\n* 如果您遇到`Error: spawn ENOENT`则表示``未安装或未在您的 PATH 中可见：\n * 确保安装它并将其添加到您的 PATH。\n * 或者在配置的`command`字段中提供命令的绝对路径。例如，将`python`替换为`/opt/miniconda3/bin/python`","Chinese","zh-CN","githubUser","locale",{"_90":91,"_20":92,"_101":47,"_102":47,"_23":103,"_104":105,"_38":48,"_123":124,"_131":-5,"_132":133,"_134":135,"_181":182,"_187":-5,"_112":166,"_188":189,"_8":190,"_191":192},"addedAt","2025-03-14T00:00:58.261643Z",[93,94,95,96,97,98,99,100],"author:official","category:rag-systems","category:databases","environment:network","hosting:remote-capable","language:jupyter notebook","security_grade:a","quality_grade:a","descriptionMarkdown","descriptionPlainText",1828,"integrations",[106,116],{"_107":108,"_36":114,"_8":115},"brand",{"_109":110,"_38":111,"_112":113},"logoSvgPath","M24 0v24H0V0h24ZM10.933 15.89H6.84v5.52h4.198v-.93H7.955v-1.503h2.77v-.93h-2.77v-1.224h2.978v-.934Zm2.146 0h-1.084v5.52h1.035v-3.6l2.226 3.6h1.118v-5.52h-1.036v3.686l-2.259-3.687Zm5.117 0h-1.208l1.973 5.52h1.19l1.976-5.52h-1.182l-1.352 4.085-1.397-4.086ZM5.4 19.68H3.72v1.68H5.4v-1.68Z",".ENV","slug","dotenv","Used for loading environment variables from a .env file, specifically for storing and accessing the Unstructured API key","sc4n0bdx55",{"_107":117,"_36":121,"_8":122},{"_109":118,"_38":119,"_112":120},"M14.25.18l.9.2.73.26.59.3.45.32.34.34.25.34.16.33.1.3.04.26.02.2-.01.13V8.5l-.05.63-.13.55-.21.46-.26.38-.3.31-.33.25-.35.19-.35.14-.33.1-.3.07-.26.04-.21.02H8.77l-.69.05-.59.14-.5.22-.41.27-.33.32-.27.35-.2.36-.15.37-.1.35-.07.32-.04.27-.02.21v3.06H3.17l-.21-.03-.28-.07-.32-.12-.35-.18-.36-.26-.36-.36-.35-.46-.32-.59-.28-.73-.21-.88-.14-1.05-.05-1.23.06-1.22.16-1.04.24-.87.32-.71.36-.57.4-.44.42-.33.42-.24.4-.16.36-.1.32-.05.24-.01h.16l.06.01h8.16v-.83H6.18l-.01-2.75-.02-.37.05-.34.11-.31.17-.28.25-.26.31-.23.38-.2.44-.18.51-.15.58-.12.64-.1.71-.06.77-.04.84-.02 1.27.05zm-6.3 1.98l-.23.33-.08.41.08.41.23.34.33.22.41.09.41-.09.33-.22.23-.34.08-.41-.08-.41-.23-.33-.33-.22-.41-.09-.41.09zm13.09 3.95l.28.06.32.12.35.18.36.27.36.35.35.47.32.59.28.73.21.88.14 1.04.05 1.23-.06 1.23-.16 1.04-.24.86-.32.71-.36.57-.4.45-.42.33-.42.24-.4.16-.36.09-.32.05-.24.02-.16-.01h-8.22v.82h5.84l.01 2.76.02.36-.05.34-.11.31-.17.29-.25.25-.31.24-.38.2-.44.17-.51.15-.58.13-.64.09-.71.07-.77.04-.84.01-1.27-.04-1.07-.14-.9-.2-.73-.25-.59-.3-.45-.33-.34-.34-.25-.34-.16-.33-.1-.3-.04-.25-.02-.2.01-.13v-5.34l.05-.64.13-.54.21-.46.26-.38.3-.32.33-.24.35-.2.35-.14.33-.1.3-.06.26-.04.21-.02.13-.01h5.84l.69-.05.59-.14.5-.21.41-.28.33-.32.27-.35.2-.36.15-.36.1-.35.07-.32.04-.28.02-.21V6.07h2.09l.14.01zm-6.47 14.25l-.23.33-.08.41.08.41.23.33.33.23.41.08.41-.08.33-.23.23-.33.08-.41-.08-.41-.23-.33-.33-.23-.41-.08-.41.08z","Python","python","Serves as the implementation language for the MCP server, with specific dependencies including unstructured-client for API interaction","9i6u9t8zx7","namespace",{"_125":126,"_112":130},"owner",{"_127":128},"githubAccount",{"_129":130},"login","Unstructured-IO","readmeMarkdown","redditPostExternalId","1jbu1l1","repository",{"_136":137,"_150":151,"_155":156,"_174":-5,"_175":176,"_177":-5,"_178":179},"argumentsJsonSchema",{"_138":139,"_147":148,"_12":149},"properties",{"_140":141,"_144":145},"FIRECRAWL_API_KEY",{"_36":142,"_12":143},"API key for using Firecrawl web crawling API features","string","UNSTRUCTURED_API_KEY",{"_36":146,"_12":143},"Your Unstructured API key fetched from https://platform.unstructured.io/app/account/api-keys","required",[144],"object","githubProject",{"_40":152,"_153":154},"# Unstructured API MCP Server\n\nAn MCP server implementation for interacting with the Unstructured API. This server provides tools to list sources and workflows.\n\n## Available Tools\n\n| Tool | Description |\n|-------------------------------------|------------------------------------------------------------------------------------------------------------------|\n| `list_sources` | Lists available sources from the Unstructured API. |\n| `get_source_info` | Get detailed information about a specific source connector. |\n| `create_source_connector` | Create a source connector.) |\n| `update_source_connector` | Update an existing source connector by params. |\n| `delete_source_connector` | Delete a source connector by source id. |\n| `list_destinations` | Lists available destinations from the Unstructured API. |\n| `get_destination_info` | Get detailed info about a specific destination connector |\n| `create_destination_connector` | Create a destination connector by params. |\n| `update_destination_connector` | Update an existing destination connector by destination id. |\n| `delete_destination_connector` | Delete a destination connector by destination id. |\n| `list_workflows` | Lists workflows from the Unstructured API. |\n| `get_workflow_info` | Get detailed information about a specific workflow. |\n| `create_workflow` | Create a new workflow with source, destination id, etc. |\n| `run_workflow` | Run a specific workflow with workflow id |\n| `update_workflow` | Update an existing workflow by params. |\n| `delete_workflow` | Delete a specific workflow by id. |\n| `list_jobs` | Lists jobs for a specific workflow from the Unstructured API. |\n| `get_job_info` | Get detailed information about a specific job by job id. |\n| `cancel_job` | Delete a specific job by id. |\n| `list_workflows_with_finished_jobs` | Lists all workflows that have any completed job, together with information about source and destination details. |\n\nBelow is a list of connectors the `UNS-MCP` server currently supports, please see the full list of source connectors that Unstructured platform supports [here](https://docs.unstructured.io/api-reference/workflow/sources/overview) and destination list [here](https://docs.unstructured.io/api-reference/workflow/destinations/overview). We are planning on adding more!\n\n| Source | Destination |\n|--------------|--------------------------------|\n| S3 | S3 |\n| Azure | Weaviate |\n| Google Drive | Pinecone |\n| OneDrive | AstraDB |\n| Salesforce | MongoDB |\n| Sharepoint | Neo4j |\n| | Databricks Volumes |\n| | Databricks Volumes Delta Table |\n\n\nTo use the tool that creates/updates/deletes a connector, the credentials for that specific connector must be defined in your .env file. Below is the list of `credentials` for the connectors we support:\n\n| Credential Name | Description |\n|-------------------------------------------------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| `ANTHROPIC_API_KEY` | required to run the `minimal_client` to interact with our server. |\n| `AWS_KEY`, `AWS_SECRET` | required to create S3 connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/api-reference/workflow/sources/s3) and [here](https://docs.unstructured.io/api-reference/workflow/destinations/s3) |\n| `WEAVIATE_CLOUD_API_KEY` | required to create Weaviate vector db connector, see how in [documentation](https://docs.unstructured.io/api-reference/workflow/destinations/weaviate) |\n| `FIRECRAWL_API_KEY` | required to use Firecrawl tools in `external/firecrawl.py`, sign up on [Firecrawl](https://www.firecrawl.dev/) and get an API key. |\n| `ASTRA_DB_APPLICATION_TOKEN`, `ASTRA_DB_API_ENDPOINT` | required to create Astradb connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/astradb) |\n| `AZURE_CONNECTION_STRING` | required option 1 to create Azure connector via ``uns-mcp`` server, see how in [documentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME`+`AZURE_ACCOUNT_KEY` | required option 2 to create Azure connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `AZURE_ACCOUNT_NAME`+`AZURE_SAS_TOKEN` | required option 3 to create Azure connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/sources/azure-blob-storage) |\n| `NEO4J_PASSWORD` | required to create Neo4j connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/neo4j) |\n| `MONGO_DB_CONNECTION_STRING` | required to create Mongodb connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/mongodb) |\n| `GOOGLEDRIVE_SERVICE_ACCOUNT_KEY` | a string value. The original server account key (follow [documentation](https://docs.unstructured.io/ui/sources/google-drive)) is in json file, run `base64 < /path/to/google_service_account_key.json` in terminal to get the string value |\n| `DATABRICKS_CLIENT_ID`,`DATABRICKS_CLIENT_SECRET` | required to create Databricks volume/delta table connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/databricks-volumes) and [here](https://docs.unstructured.io/ui/destinations/databricks-delta-table) |\n| `ONEDRIVE_CLIENT_ID`, `ONEDRIVE_CLIENT_CRED`,`ONEDRIVE_TENANT_ID` | required to create One Drive connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/onedrive) |\n| `PINECONE_API_KEY` | required to create Pinecone vector DB connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/destinations/pinecone) |\n| `SALESFORCE_CONSUMER_KEY`,`SALESFORCE_PRIVATE_KEY` | required to create salesforce source connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ingestion/source-connectors/salesforce) |\n| `SHAREPOINT_CLIENT_ID`, `SHAREPOINT_CLIENT_CRED`,`SHAREPOINT_TENANT_ID` | required to create One Drive connector via `uns-mcp` server, see how in [documentation](https://docs.unstructured.io/ui/sources/sharepoint) |\n| `LOG_LEVEL` | Used to set logging level for our `minimal_client`, e.g. set to ERROR to get everything |\n| `CONFIRM_TOOL_USE` | set to true so that `minimal_client` can confirm execution before each tool call |\n| `DEBUG_API_REQUESTS` | set to true so that `uns_mcp/server.py` can output request parameters for better debugging |\n\n\n### Firecrawl Source\n\n[Firecrawl](https://www.firecrawl.dev/) is a web crawling API that provides two main capabilities in our MCP:\n\n1. **HTML Content Retrieval**: Using `invoke_firecrawl_crawlhtml` to start crawl jobs and `check_crawlhtml_status` to monitor them\n2. **LLM-Optimized Text Generation**: Using `invoke_firecrawl_llmtxt` to generate text and `check_llmtxt_status` to retrieve results\n\nHow Firecrawl works:\n\n**Web Crawling Process:**\n- Starts with a specified URL and analyzes it to identify links\n- Uses the sitemap if available; otherwise follows links found on the website\n- Recursively traverses each link to discover all subpages\n- Gathers content from every visited page, handling JavaScript rendering and rate limits\n- Jobs can be cancelled with `cancel_crawlhtml_job` if needed\n- Use this if you require all the info extracted into raw HTML, Unstructured's workflow cleans it up really well :smile:\n\n**LLM Text Generation:**\n- After crawling, extracts clean, meaningful text content from the crawled pages\n- Generates optimized text formats specifically formatted for large language models\n- Results are automatically uploaded to the specified S3 location\n- Note: LLM text generation jobs cannot be cancelled once started. The `cancel_llmtxt_job` function is provided for consistency but is not currently supported by the Firecrawl API.\n\nNote: A `FIRECRAWL_API_KEY` environment variable must be set to use these functions.\n\n## Installation & Configuration\n\nThis guide provides step-by-step instructions to set up and configure the UNS_MCP server using Python 3.12 and the `uv` tool.\n\n## Prerequisites\n- Python 3.12+\n- `uv` for environment management\n- An API key from Unstructured. You can sign up and obtain your API key [here](https://platform.unstructured.io/app/account/api-keys).\n\n### Using `uv` (Recommended)\n\nNo additional installation is required when using `uvx` as it handles execution. However, if you prefer to install the package directly:\n```bash\nuv pip install uns_mcp\n```\n\n#### Configure Claude Desktop\nFor integration with Claude Desktop, add the following content to your `claude_desktop_config.json`:\n\n**Note:** The file is located in the `~/Library/Application Support/Claude/` directory.\n\n**Using `uvx` Command:**\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"uvx\",\n \"args\": [\"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n**Alternatively, Using Python Package:**\n```json\n{\n \"mcpServers\": {\n \"UNS_MCP\": {\n \"command\": \"python\",\n \"args\": [\"-m\", \"uns_mcp\"],\n \"env\": {\n \"UNSTRUCTURED_API_KEY\": \"\"\n }\n }\n }\n}\n```\n\n### Using Source Code\n1. Clone the repository.\n\n2. Install dependencies:\n ```bash\n uv sync\n ```\n\n3. Set your Unstructured API key as an environment variable. Create a .env file in the root directory with the following content:\n ````bash\n UNSTRUCTURED_API_KEY=\"YOUR_KEY\"\n ````\n Refer to `.env.template` for the configurable environment variables.\n\nYou can now run the server using one of the following methods:\n\n

\nUsing Editable Package Installation\n

\n\n

\nUsing SSE Server Protocol\n

\n\n

\nUsing Stdio Server Protocol\n

MCP directory API