gemini-2.5-flash vs glm-4.7

Pricing, Performance & Features Comparison

gemini-2.5-flash

Authorgoogle

Context Length1M

Reasoning

Providers1

ReleasedJun 2025

Knowledge CutoffJan 2025

License-

Gemini 2.5 Flash is our best model in terms of price and performance, and offers well-rounded capabilities.

Input$0.15

Output$0.6

Latency (p50)963ms

Output Limit66K

Function Calling

JSON Mode

Input-

Output-

google-vertex

in$0.15out$0.6--

Latency (24h)

Success Rate (24h)

glm-4.7

Authorzai

Context Length200K

Reasoning

Providers1

ReleasedDec 2025

Knowledge Cutoff-

License-

GLM-4.7 is Z.AI’s latest flagship model, featuring upgrades in two key areas: enhanced programming capabilities and more stable multi-step reasoning/execution. It demonstrates significant improvements in executing complex agent tasks while delivering more natural conversational experiences and superior front-end aesthetics.

Input$0.6

Output$2.2

Latency (p50)3.7s

Output Limit128K

Function Calling

JSON Mode

Input-

Output-

zai

in$0.6out$2.2cache$0.11-