parse_record
Extract and inventory Korean case record folders or single PDF files. Parses documents into structured chunks with page count and scan status using OCR engines.
Instructions
사건기록 폴더(또는 단일 PDF)를 추출·인벤토리화. opendataloader 우선, pymupdf 폴백.
source: 사건기록 폴더 경로 또는 PDF 경로. engine: 'auto'|'opendataloader'|'pymupdf'|'pdfplumber'. 반환: 인벤토리·청크 추출본 경로·총면수·정독모드·스캔본·경고.
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| engine | No | auto | |
| source | Yes | ||
| subject | No | 기록 | |
| out_root | No |