小米MiMo-V2.5API永久降价最高99%！ Token Plan 一个月只要 5.3 美金

小米拼了！有在使用OpenClaw或Hermes的朋友注意这个好康消息，小米MiMo官方于5月27日宣布，旗下MiMo-V2.5系列API即日起永久调降价格，最高降幅达99%，同时取消长上下文倍率加价制度，所有输入长度统一计费。这是继DeepSeek三天前将V4-Pro永久降价至原价1/4之后，AI市场又一次大规模的价格调整。降价后，MiMo-V2.5系列的海外美元定价与DeepSeek几乎完全一致，两家AI厂商在API价格上正式进入贴身肉搏的境界。

MiMo-V2.5 系列包含 V2.5 与 V2.5 Pro 两个版本，此次调降后的新价格不再区分上下文长度，无论是 1K 的短提示还是 1M token 的长文件，通通适用同一计价公式，大幅简化了计费规则。同时Token Plan预付方案也同步升级，可用额度提升5到8倍，且所有已消耗的配额全额重置。语音合成API MiMo-V2.5-TTS则继续维持免费，对于有语音需求的开发者来说是一项额外红利。

价格战脉络：DeepSeek 点火，全产业跟进

这波降价的直接导火线来自 DeepSeek。 5 月 24 日，DeepSeek 宣布旗下旗舰模型 V4-Pro 永久降价至原参考价格的 1/4，调整后输入价格为 $0.435/MTok、输出 $0.87/MTok。仅三天后，小米MiMo就跟进宣布降价，且调整后的美元定价与DeepSeek完全一致。

降价幅度：最高砍掉99%

根据MiMo官方公告，以人民币计算，V2.5 Pro的输入快取命中价格降至每百万 token 仅 ¥0.025，降幅达 99%; 输出价格降至 ¥6.00/MTok，降幅 86%。 V2.5 基本版的输出价格则降至 ¥2.00/MTok，降幅达 93%。

小米MiMo-V2.5API永久降价最高99%！ Token Plan 一个月只要 5.3 美金

在全球美元定价方面，降价后的MiMo-V2.5系列与DeepSeek的定价几乎完全重叠：

MiMo-V2.5 Pro（海外定价）

– 输入（快取命中）：$0.0036 | 输入（未命中）：$0.435 | 输出：$0.87

MiMo-V2.5（海外定价）

– 输入（快取命中）：$0.0028 | 输入（未命中）：$0.14 | 输出：$0.28

DeepSeek V4-Pro（永久降价后）

– 输入（快取命中）：$0.0145 | 输入（未命中）：$0.435 | 输出：$0.87

DeepSeek V4 Flash

– 输入（快取命中）：$0.0028 | 输入（未命中）：$0.14 | 输出：$0.28

从数字可以清楚看到，MiMo-V2.5 Pro 与 DeepSeek V4-Pro 的输入/输出价格完全相同（$0.435/$0.87），MiMo-V2.5 与 DeepSeek V4 Flash 也完全相同（$0.14/$0.28）。唯一的差异在快取命中价格：MiMo-V2.5 Pro 的 $0.0036 比 DeepSeek V4-Pro 的 $0.0145 便宜约 75%，对于大量使用快取的场景（如长文件重复处理、Agent 多轮对话）能省下更多成本，而且 MiMo-V2.5 还有 DeepSeek 没有的 Token Plan 用量，而且使用量还直接提升 5~8 倍不涨价，降幅相当有感。

将MiMo与DeepSeek放在一起看，AI模型在海外美元市场已形成一个极具竞争力的价格梯队。相比之下，西方主要AI厂商的定价仍高出数倍：

OpenAI GPT-5.5

– 输入：$5.00 | 输出：$30.00 | 上下文 128K

OpenAI GPT-5.4

– 输入：$2.50 | 输出：$15.00 | 上下文 128K

Claude Opus 4.7（Anthropic）

– 输入：$5.00 | 输出：$25.00 | 上下文 200K

Claude Sonnet 4.6（Anthropic）

– 输入：$3.00 | 输出：$15.00 | 上下文 200K

Claude Haiku 4.5（Anthropic）

– 输入：$1.00 | 输出：$5.00 | 上下文 200K

以最直接的对比来看，MiMo-V2.5 Pro 的输出价格 $0.87/MTok 仅为 GPT-5.5 的 1/34、Claude Opus 4.7 的 1/28。即使与 Anthropic 最便宜的 Haiku 4.5（$5.00/MTok 輸出）相比，MiMo-V2.5 Pro 仍然便宜近 5 倍。而在上下文容量方面，MiMo-V2.5 系列支持 1M token，是 Claude 200K 的 5 倍、GPT-5.5 128K 的近 8 倍。

而MiMo与DeepSeek的定价几乎完全一致，这并非巧合。两家厂商都在近期完成了推理效率的大幅优化，将成本下降的空间回馈给开发者，代表了 AI 市场的价格竞争已从过去的「烧钱补贴」转变为「效率驱动」的结构性降价。

Token Plan 升级：额度增5-8倍、已消耗配额全额重置

除了API的即时计费调降外，MiMo也同步升级了Token Plan预付方案。现有用户的可用额度提升至原先的5到8倍，且所有在有效期内已使用的Token配额将会全额重置归零重新计算。这项措施对于已经购买了年约或季约方案的开发者来说，等于直接获得了一笔额外的预算补贴。

降价背后的技术驱动力

MiMo 官方在公告中指出，此次降价的基础来自于持续的推理效率优化。技术团队全面支持基于 SGLang HiCache 的 SWA（Sliding Window Attention），将 KV Cache 在 GPU 内存、CPU 内存与 SSD 等多层储存之间的资料传输量降至优化前的 1/7，可快取 token 数量提升至原先的 5 倍，大幅提高了快取命中率与推理效率（其实就是使用 DeepSeek 开源的压缩技巧）。同时通过专家并行方案的优化，进一步提升了丛集的输入吞吐能力。

此外，V2.5 相较于 V2-Pro 在模型能力上也有所升级：长上下文检索质量提升（200K-800K 范围的 needle-in-haystack 准确率维持 95% 以上）、并行工具呼叫的 JSON 错误率降低、以及训练数据更新至 2026 年第一季。而且更吸引人的是 MiMo V2.5 Pro 在性能上还比 DeepSeek V4 Pro 来的强不少，而且还是可以辨识图片与视频的多模态模型，在价位相同的情况下更加吸引人。

以一个典型的 Agent 应用场景为例：每天处理 1,000 次对话，每次平均 5,000 token 输入搭配 2,000 token 输出，使用 MiMo-V2.5 Pro 的月成本约为 $117 美元（约 NT$3,750），同样的工作量在Claude Sonnet 4.6上约需 $1,350美元（约 NT$43,200），在 GPT-5.5 上约需 $2,550 美元（约 NT$81,600），差距超过 11 到 22 倍。这使得过去因成本考量而无法负担顶级模型的中小开发团队，现在也能轻松使用高品质的 AI 服务。而且如果使用 Token Plan 的话，只是用来给 OpenClaw 或 Hermes 做 Agent 工作使用根本用不完，年缴也不到 64 美金，等于一个月才 5.33 美金就用到饱，非常值得考虑。

结语

小米MiMo-V2.5的降价，是本周内继DeepSeek之后第二起大型AI API价格调整事件。降价后，MiMo与DeepSeek的海外美元定价几乎完全一致，AI模型在API价格上已形成全球最低价梯队，输出价格仅为西方主要厂商的1/11到1/22。对于开发者来说，选择正在快速增加，而更低的 API 价格意味着更便宜的 AI 应用与服务。 MiMo 的快取命中价格（$0.0036/MTok）较 DeepSeek（$0.0145/MTok）更具优势，对于依赖长上下文快取的 Agent 应用场景，MiMo 可能是更经济的选择。