ingest_docx
Parses DOCX and DOC files into DFM format, preserving complex elements like merged tables, charts, headers/footers, macros, and table of contents for editing in VS Code.
Instructions
攝入 .docx / .doc 文件,轉換為 DFM (Docx-Flavored Markdown) 格式。
將 docx 解析為中間表示 (IR),再轉換為可在 VS Code 中編輯的 DFM 格式。 支援複雜元素:合併表格、圖表、頁首頁尾、巨集、目錄等。 支援舊版 .doc 格式(自動透過 LibreOffice 轉換為 .docx)。
輸出目錄結構:
data/{doc_id}/
├── content.dfm # 可編輯的 Markdown + YAML 標注
├── ir.json # IR 快照(用於回寫)
├── original.docx # 原始檔案備份
├── parts/ # 保留的 XML 零件
└── assets/ # 圖片和二進位資產Args: file_path: .docx 或 .doc 檔案的絕對路徑
Returns: 攝入結果摘要(doc_id、區塊數量等)
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| file_path | Yes | ||
| ctx | No |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
| result | Yes |