read_word_document
Extract text, tables, and OCR-analyzed images from Word documents with configurable caching and output options for efficient document processing.
Instructions
增强版Word文档读取器,支持表格提取、图片OCR分析和缓存优化
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| filePath | Yes | Word文档的文件路径 | |
| memoryKey | No | 用于存储的内存键名,便于后续检索 | default |
| documentType | No | 文档类型 | common-doc |
| extractTables | No | 是否提取表格 | |
| extractImages | No | 是否提取图片并进行OCR分析 | |
| useCache | No | 是否使用缓存 | |
| outputDir | No | 图片和临时文件输出目录 | ./output |