understand_video
Analyze and summarize video content. Provide a prompt and video URL or file to receive descriptions, key points, and action recognition results.
Instructions
调用小米 MIMO 多模态模型理解视频。
何时使用:当需要分析、描述、总结视频内容时使用。 不要用于:读取视频文件元数据或源码,这些应使用其他工具。
Args: prompt: 视频理解任务描述,如"描述视频内容"、"总结视频要点"、"识别视频中的动作" video_url: 单个网络视频 URL video_path: 单个本地视频文件路径 video_urls: 多个网络视频 URL video_paths: 多个本地视频文件路径 fps: 每秒抽帧数,范围 [0.1, 10],默认 2。越高时序越精细 media_resolution: 视频帧分辨率档次,"default" 或 "max" system_prompt: 可选系统提示词,用于自定义模型行为 max_tokens: 最大输出长度 (默认 8192,最大 32768)
Returns: MIMO 模型返回的视频理解结果。
支持格式:MP4,MOV,AVI,WMV 大小限制:URL方式300MB,Base64方式50MB
Input Schema
| Name | Required | Description | Default |
|---|---|---|---|
| fps | No | ||
| prompt | Yes | ||
| video_url | No | ||
| max_tokens | No | ||
| video_path | No | ||
| video_urls | No | ||
| video_paths | No | ||
| system_prompt | No | ||
| media_resolution | No | default |
Output Schema
| Name | Required | Description | Default |
|---|---|---|---|
| result | Yes |