jp_lit_search_pages
Search within NDL Digital Collection documents for pages containing a specific keyword in OCR text. Specify a document by source_id or pid to find matching page results.
Instructions
read-only。NDL デジタルコレクション資料内のページをキーワードで全文検索する(インターネット公開資料のみ)。source_id を使う場合は事前に jp_lit_get_record で next_digital_library.available=true を確認すること。全資料から候補 pid を探す段階では jp_lit_search_fulltext、特定ページの OCR テキストと画像 URL 確認は jp_lit_get_text_coordinates を使う。jp_lit_search_fulltext の結果の pid はそのまま渡してよい
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| source | Yes | 通常は ndl_digital。source_id を使う場合は jp_lit_get_record で OCR 利用可否を確認してから指定する。 | |
| source_id | No | NDL デジタルコレクションの source_id。pid が分かる場合は pid を優先できる。 | |
| pid | No | 次世代デジタルライブラリーの pid。jp_lit_search_fulltext の結果から直接渡せる。 | |
| keyword | Yes | 資料内 OCR テキストから探す語。 | |
| size | No | 返すページ一致の最大件数。最大 100。 | |
| from | No | 検索結果の offset。0 始まり。 | |
| force_refresh | No | true の場合はローカル cache を使わず upstream API から再取得する。false の場合は保存済み cache を優先する。 |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
| pid | Yes | ||
| keyword | Yes | ||
| total | Yes | ||
| from | Yes | ||
| items | No | ||
| raw | Yes | ||
| cache | No |