界面新闻记者 | 宋佳楠
5月27日,小米技术发布公告称,MiMo-V2.5系列API实施永久降价,最高降幅达99%。这也是继DeepSeek之后,又一家宣布API永久降价的大模型公司。
此次小米降价自今日起生效,其不仅取消了传统定价中区分上下文窗口长度的做法,还对Token Plan计费体系进行优化:在同等付费价格下,Token用量可提升至原来的5至8倍,更具性价比。
从具体定价与降幅细节来看,MiMo-V2.5-Pro调价后输入缓存命中价格仅0.025元/百万tokens,相较于原价≤256k规格1.40元降幅达98%,对比256k-1M规格2.80元降幅更是触及99%;输入未命中缓存定价3.000元/百万tokens,较原价7.00元下降57%,对比长窗口原价14.00元降幅79%;输出定价6元/百万tokens,相较原价21元、42元分别下降71%与86%。
![]()
标准版MiMo-V2.5降价力度同样不小,输入缓存命中调价后为0.020元/百万tokens,较≤256k原价0.56元降幅96%,较256k-1M原价1.12元降幅98%;输入未命中缓存定价1.000元/百万tokens,相比原价2.80元降幅64%,对比长窗口原价5.60元降幅82%;输出定价2元/百万tokens,较原价14元、28元分别下滑86%与93%。
值得注意的是,本次调价主要聚焦MiMo-V2.5核心系列,MiMo-V2.5-TTS系列依旧保持限时免费接入政策,而MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型API价格维持原价不变,同时其Token Plan套餐也不再参与调整并即将下线,引导开发者向高性价比的V2.5系列迁移。
MiMo-V2.5系列的迭代由小米AI领军人物罗福莉主导。2025年11月,曾任职DeepSeek的95后AI技术人才罗福莉正式加盟小米,出任MiMo大模型负责人,组建起平均年龄25岁、清北毕业生占比超六成的研发团队。有消息显示,雷军以千万年薪力邀罗福莉加入小米。
在罗福莉的统筹下,小米MiMo大模型完成多代快速迭代,今年3月正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型,后续迭代升级出V2.5进阶版本,补齐高性能推理、轻量化通用交互、语音合成等全场景能力,成为小米大模型阵列中面向商用普惠市场的主力产品。
目前小米已构建较为完善的MiMo大模型产品矩阵。具体来看,MiMo-V2.5-Pro主打高性能复杂推理,适配企业级智能体开发、深度业务分析等高阶商用场景;MiMo-V2.5聚焦轻量化通用需求,主打中小开发者日常调用与轻量化应用落地;MiMo-V2.5-TTS主要瞄准语音合成赛道,以免费策略抢占音频生态入口。此外,MiMo-V2-Pro作为旗舰基座模型,主打万亿参数MoE架构性能突破,MiMo-V2-Omni专注全模态融合。
就在昨日,小米创始人雷军表示,“Xiaomi MiMo-V2.5-Pro跻身Artificial Analysis榜单综合智能指数、Agent指数全球开源模型并列第一,未来三年在AI领域计划投入600亿元。”
小米宣布降价前,国内另一头部大模型公司DeepSeek已先一步开启“永久降价”,主要针对DeepSeek-V4-Pro模型,对应API于5月31日结束限时优惠后,整体调整为原定价的四分之一。调价后,输入缓存命中0.025元/百万tokens、未命中缓存3元/百万tokens、输出6元/百万tokens,相较原价实现75%的降幅。
DeepSeek-V4于今年4月下旬发布,其拥有百万字超长上下文,在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先,主要包括DeepSeek-V4-Flash和DeepSeek-V4-Pro两款模型。DeepSeek-V4-Pro调用成本远低于GPT-4o、Claude等国际主流模型,快速抢占开发者与企业用户群体,也为小米等厂商跟进降价提供了市场范本。
除小米与DeepSeek外,国内大模型市场也呈现出明显的K型分化特征。阿里云通义千问、字节跳动豆包等通用型大模型相继下调API调用价格,而智谱GLM、腾讯混元等主打企业定制服务的模型则维持价格稳定甚至小幅上调,形成“通用模型降价走量、高端模型溢价保值”的新格局。
这一现象背后,是行业从无序价格战向技术效率竞争的转型,降价不再是单纯的市场营销手段,而是底层算法优化、推理技术升级、算力成本下行共同驱动的必然结果。
AI聚合平台AI.cc发布的2026年AI API基础设施报告显示,过去一年企业级大模型Token调用成本同比暴跌67%,开源模型已占据企业Token调用量38%的份额,性价比已成为市场核心竞争要素。