extract_paper_tables
Extract tables from academic PDFs by cropping captioned regions and save them as PNG images in a vault directory.
Instructions
캐시된 PDF에서 caption 기준 영역 crop으로 table을 vault에 저장 (ADR-018).
저장 위치: vault/papers/<slug>/tables/table_<n>.png. 각 table은 caption +
그 아래 일정 영역을 raster로 렌더해 1 PNG에 보존 (table 본체는 PDF 내부 vector
text라 sub-image 분리가 불가능 — 영역 crop이 유일한 방법).
Args: paper_id: arXiv ID. slug: vault 디렉토리명. 비우면 arxiv_id 사용.
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| paper_id | Yes | ||
| slug | No |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
| result | Yes |