get_document
Retrieve metadata and statistics for a document by its unique identifier, including title, authors, year, venue, and chunk details.
Instructions
获取指定文档的元数据和统计信息
根据 doc_id 获取文档的完整元数据,包括标题、作者、chunk 数量等。
Args: doc_id: 文档的唯一标识符(SHA256 哈希)
Returns: 文档的详细信息,包含: - 元数据:title, authors, year, venue, doi, url - 存储信息:pdf_bucket, pdf_key - 统计:chunk_count, embedded_chunk_count, total_tokens
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| doc_id | Yes |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
No arguments | |||