get_pdf_text_bulk
Extract plain text from multiple PDF pages for content understanding. Use this tool to quickly grasp the full text of a large PDF, then follow up with coordinate-based extraction for precise annotations.
Instructions
批量提取多页 PDF 纯文本(无坐标),适合大 PDF 内容理解。
与 get_pdf_layout_text 的区别:不返回坐标,context 占用减少 ~80%。 推荐工作流:
先用此工具理解全文 → 确定目标页和目标句子
再用 get_pdf_layout_text 获取目标页的精确坐标
最后用 create_pdf_annotation 写入标注
Args: item_id: Zotero PDF 附件的 itemID(数字),或 PDF 文件的绝对路径 pages: 要提取的页码列表(0-indexed),不传则提取全文 skip_refs: 是否自动跳过参考文献页(默认 True)
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| item_id | Yes | ||
| pages | No | ||
| skip_refs | No |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
| result | Yes |