jp_lit_get_text_coordinates
Retrieve OCR text and coordinates for a page from NDL Digital Collection public materials. Use source and page number, or a pid from search results.
Instructions
read-only。NDL デジタルコレクション資料のページ単位 OCR テキストと座標を取得する(インターネット公開資料のみ)。source_id を使う場合は事前に jp_lit_get_record で next_digital_library.available=true を確認すること。ページ番号を探す段階では jp_lit_search_pages、全文一括取得は jp_lit_get_fulltext を使う。jp_lit_search_fulltext の結果の pid はそのまま渡してよい
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| source | Yes | 通常は ndl_digital。source_id を使う場合は jp_lit_get_record で OCR 利用可否を確認してから指定する。 | |
| source_id | No | NDL デジタルコレクションの source_id。pid が分かる場合は pid を優先できる。 | |
| pid | No | 次世代デジタルライブラリーの pid。jp_lit_search_fulltext の結果から直接渡せる。 | |
| page | Yes | 取得するページ番号。1 始まり。 | |
| force_refresh | No | true の場合はローカル cache を使わず upstream API から再取得する。false の場合は保存済み cache を優先する。 |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
| pid | Yes | ||
| page | Yes | ||
| page_image_url | Yes | ||
| contents | No | ||
| coordjson | No | ||
| raw | Yes | ||
| cache | No |