小米拼了! 有在使用OpenClaw或Hermes的朋友注意这个好康消息,小米MiMo官方于5月27日宣布,旗下MiMo-V2.5系列API即日起永久调降价格,最高降幅达99%,同时取消长上下文倍率加价制度,所有输入长度统一计费。 这是继DeepSeek三天前将V4-Pro永久降价至原价1/4之后,AI市场又一次大规模的价格调整。 降价后,MiMo-V2.5系列的海外美元定价与DeepSeek几乎完全一致,两家AI厂商在API价格上正式进入贴身肉搏的境界。
MiMo-V2.5 系列包含 V2.5 与 V2.5 Pro 两个版本,此次调降后的新价格不再区分上下文长度,无论是 1K 的短提示还是 1M token 的长文件,通通适用同一计价公式,大幅简化了计费规则。 同时Token Plan预付方案也同步升级,可用额度提升5到8倍,且所有已消耗的配额全额重置。 语音合成API MiMo-V2.5-TTS则继续维持免费,对于有语音需求的开发者来说是一项额外红利。
价格战脉络:DeepSeek 点火,全产业跟进
这波降价的直接导火线来自 DeepSeek。 5 月 24 日,DeepSeek 宣布旗下旗舰模型 V4-Pro 永久降价至原参考价格的 1/4,调整后输入价格为 $0.435/MTok、输出 $0.87/MTok。 仅三天后,小米MiMo就跟进宣布降价,且调整后的美元定价与DeepSeek完全一致。
降价幅度:最高砍掉99%
根据MiMo官方公告,以人民币计算,V2.5 Pro的输入快取命中价格降至每百万 token 仅 ¥0.025,降幅达 99%; 输出价格降至 ¥6.00/MTok,降幅 86%。 V2.5 基本版的输出价格则降至 ¥2.00/MTok,降幅达 93%。

在全球美元定价方面,降价后的MiMo-V2.5系列与DeepSeek的定价几乎完全重叠:
MiMo-V2.5 Pro(海外定价)
– 输入(快取命中):$0.0036 | 输入(未命中):$0.435 | 输出:$0.87
MiMo-V2.5(海外定价)
– 输入(快取命中):$0.0028 | 输入(未命中):$0.14 | 输出:$0.28

DeepSeek V4-Pro(永久降价后)
– 输入(快取命中):$0.0145 | 输入(未命中):$0.435 | 输出:$0.87
DeepSeek V4 Flash
– 输入(快取命中):$0.0028 | 输入(未命中):$0.14 | 输出:$0.28

从数字可以清楚看到,MiMo-V2.5 Pro 与 DeepSeek V4-Pro 的输入/输出价格完全相同($0.435/$0.87),MiMo-V2.5 与 DeepSeek V4 Flash 也完全相同($0.14/$0.28)。 唯一的差异在快取命中价格:MiMo-V2.5 Pro 的 $0.0036 比 DeepSeek V4-Pro 的 $0.0145 便宜约 75%,对于大量使用快取的场景(如长文件重复处理、Agent 多轮对话)能省下更多成本,而且 MiMo-V2.5 还有 DeepSeek 没有的 Token Plan 用量,而且使用量还直接提升 5~8 倍不涨价,降幅相当有感。
将MiMo与DeepSeek放在一起看,AI模型在海外美元市场已形成一个极具竞争力的价格梯队。 相比之下,西方主要AI厂商的定价仍高出数倍:
OpenAI GPT-5.5
– 输入:$5.00 | 输出:$30.00 | 上下文 128K
OpenAI GPT-5.4
– 输入:$2.50 | 输出:$15.00 | 上下文 128K
Claude Opus 4.7(Anthropic)
– 输入:$5.00 | 输出:$25.00 | 上下文 200K
Claude Sonnet 4.6(Anthropic)
– 输入:$3.00 | 输出:$15.00 | 上下文 200K
Claude Haiku 4.5(Anthropic)
– 输入:$1.00 | 输出:$5.00 | 上下文 200K
以最直接的对比来看,MiMo-V2.5 Pro 的输出价格 $0.87/MTok 仅为 GPT-5.5 的 1/34、Claude Opus 4.7 的 1/28。 即使与 Anthropic 最便宜的 Haiku 4.5($5.00/MTok 輸出)相比,MiMo-V2.5 Pro 仍然便宜近 5 倍。 而在上下文容量方面,MiMo-V2.5 系列支持 1M token,是 Claude 200K 的 5 倍、GPT-5.5 128K 的近 8 倍。
而MiMo与DeepSeek的定价几乎完全一致,这并非巧合。 两家厂商都在近期完成了推理效率的大幅优化,将成本下降的空间回馈给开发者,代表了 AI 市场的价格竞争已从过去的「烧钱补贴」转变为「效率驱动」的结构性降价。
Token Plan 升级:额度增5-8倍、已消耗配额全额重置
除了API的即时计费调降外,MiMo也同步升级了Token Plan预付方案。 现有用户的可用额度提升至原先的5到8倍,且所有在有效期内已使用的Token配额将会全额重置归零重新计算。 这项措施对于已经购买了年约或季约方案的开发者来说,等于直接获得了一笔额外的预算补贴。

降价背后的技术驱动力
MiMo 官方在公告中指出,此次降价的基础来自于持续的推理效率优化。 技术团队全面支持基于 SGLang HiCache 的 SWA(Sliding Window Attention),将 KV Cache 在 GPU 内存、CPU 内存与 SSD 等多层储存之间的资料传输量降至优化前的 1/7,可快取 token 数量提升至原先的 5 倍,大幅提高了快取命中率与推理效率(其实就是使用 DeepSeek 开源的压缩技巧)。 同时通过专家并行方案的优化,进一步提升了丛集的输入吞吐能力。
此外,V2.5 相较于 V2-Pro 在模型能力上也有所升级:长上下文检索质量提升(200K-800K 范围的 needle-in-haystack 准确率维持 95% 以上)、并行工具呼叫的 JSON 错误率降低、以及训练数据更新至 2026 年第一季。 而且更吸引人的是 MiMo V2.5 Pro 在性能上还比 DeepSeek V4 Pro 来的强不少,而且还是可以辨识图片与视频的多模态模型,在价位相同的情况下更加吸引人。

以一个典型的 Agent 应用场景为例:每天处理 1,000 次对话,每次平均 5,000 token 输入搭配 2,000 token 输出,使用 MiMo-V2.5 Pro 的月成本约为 $117 美元(约 NT$3,750),同样的工作量在Claude Sonnet 4.6上约需 $1,350美元(约 NT$43,200),在 GPT-5.5 上约需 $2,550 美元(约 NT$81,600),差距超过 11 到 22 倍。 这使得过去因成本考量而无法负担顶级模型的中小开发团队,现在也能轻松使用高品质的 AI 服务。 而且如果使用 Token Plan 的话,只是用来给 OpenClaw 或 Hermes 做 Agent 工作使用根本用不完,年缴也不到 64 美金,等于一个月才 5.33 美金就用到饱,非常值得考虑。
结语
小米MiMo-V2.5的降价,是本周内继DeepSeek之后第二起大型AI API价格调整事件。 降价后,MiMo与DeepSeek的海外美元定价几乎完全一致,AI模型在API价格上已形成全球最低价梯队,输出价格仅为西方主要厂商的1/11到1/22。 对于开发者来说,选择正在快速增加,而更低的 API 价格意味着更便宜的 AI 应用与服务。 MiMo 的快取命中价格($0.0036/MTok)较 DeepSeek($0.0145/MTok)更具优势,对于依赖长上下文快取的 Agent 应用场景,MiMo 可能是更经济的选择。