地下室的教养,肌肉与汗水浇灌的教养,地下室里的教养修行-高峰资讯网

小米紧跟DeepSeek宣布大模型AP〈I永久降价，最高降幅〉99%

677

2026-05-27 13:23:25

界面新闻记者 | 宋佳楠

5月27日，小米技术发布公告称，MiMo-V2.5系列API实施永久降价，最高降幅达99%。这也是继DeepSeek之后，又一家宣布API永久降价的大模型公司。

此次小米降价自今日起生效，其不仅取消了传统定价中区分上下文窗口长度的做法，还对Token Plan计费体系进行优化：在同等付费价格下，Token用量可提升至原来的5至8倍，更具性价比。

从具体定价与降幅细节来看，MiMo-V2.5-Pro调价后输入缓存命中价格仅0.025元/百万tokens，相较于原价≤256k规格1.40元降幅达98%，对比256k-1M规格2.80元降幅更是触及99%；输入未命中缓存定价3.000元/百万tokens，较原价7.00元下降57%，对比长窗口原价14.00元降幅79%；输出定价6元/百万tokens，相较原价21元、42元分别下降71%与86%。

标准版MiMo-V2.5降价力度同样不小，输入缓存命中调价后为0.020元/百万tokens，较≤256k原价0.56元降幅96%，较256k-1M原价1.12元降幅98%；输入未命中缓存定价1.000元/百万tokens，相比原价2.80元降幅64%，对比长窗口原价5.60元降幅82%；输出定价2元/百万tokens，较原价14元、28元分别下滑86%与93%。

值得注意的是，本次调价主要聚焦MiMo-V2.5核心系列，MiMo-V2.5-TTS系列依旧保持限时免费接入政策，而MiMo-V2-Pro与MiMo-V2-Omni两款高阶模型API价格维持原价不变，同时其Token Plan套餐也不再参与调整并即将下线，引导开发者向高性价比的V2.5系列迁移。

MiMo-V2.5系列的迭代由小米AI领军人物罗福莉主导。2025年11月，曾任职DeepSeek的95后AI技术人才罗福莉正式加盟小米，出任MiMo大模型负责人，组建起平均年龄25岁、清北毕业生占比超六成的研发团队。有消息显示，雷军以千万年薪力邀罗福莉加入小米。

在罗福莉的统筹下，小米MiMo大模型完成多代快速迭代，今年3月正式推出MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS三大基础模型，后续迭代升级出V2.5进阶版本，补齐高性能推理、轻量化通用交互、语音合成等全场景能力，成为小米大模型阵列中面向商用普惠市场的主力产品。

目前小米已构建较为完善的MiMo大模型产品矩阵。具体来看，MiMo-V2.5-Pro主打高性能复杂推理，适配企业级智能体开发、深度业务分析等高阶商用场景；MiMo-V2.5聚焦轻量化通用需求，主打中小开发者日常调用与轻量化应用落地；MiMo-V2.5-TTS主要瞄准语音合成赛道，以免费策略抢占音频生态入口。此外，MiMo-V2-Pro作为旗舰基座模型，主打万亿参数MoE架构性能突破，MiMo-V2-Omni专注全模态融合。

就在昨日，小米创始人雷军表示，“Xiaomi MiMo-V2.5-Pro跻身Artificial Analysis榜单综合智能指数、Agent指数全球开源模型并列第一，未来三年在AI领域计划投入600亿元。”

小米宣布降价前，国内另一头部大模型公司DeepSeek已先一步开启“永久降价”，主要针对DeepSeek-V4-Pro模型，对应API于5月31日结束限时优惠后，整体调整为原定价的四分之一。调价后，输入缓存命中0.025元/百万tokens、未命中缓存3元/百万tokens、输出6元/百万tokens，相较原价实现75%的降幅。

DeepSeek-V4于今年4月下旬发布，其拥有百万字超长上下文，在Agent能力、世界知识和推理性能上均实现国内与开源领域的领先，主要包括DeepSeek-V4-Flash和DeepSeek-V4-Pro两款模型。DeepSeek-V4-Pro调用成本远低于GPT-4o、Claude等国际主流模型，快速抢占开发者与企业用户群体，也为小米等厂商跟进降价提供了市场范本。

除小米与DeepSeek外，国内大模型市场也呈现出明显的K型分化特征。阿里云通义千问、字节跳动豆包等通用型大模型相继下调API调用价格，而智谱GLM、腾讯混元等主打企业定制服务的模型则维持价格稳定甚至小幅上调，形成“通用模型降价走量、高端模型溢价保值”的新格局。

这一现象背后，是行业从无序价格战向技术效率竞争的转型，降价不再是单纯的市场营销手段，而是底层算法优化、推理技术升级、算力成本下行共同驱动的必然结果。

AI聚合平台AI.cc发布的2026年AI API基础设施报告显示，过去一年企业级大模型Token调用成本同比暴跌67%，开源模型已占据企业Token调用量38%的份额，性价比已成为市场核心竞争要素。