• 发文
  • 评论
  • 微博
  • 空间
  • 微信

95后罗福莉加入小米一年后:三款MiMo系大模型凌晨低调发布,雷军称其已超过Grok!

硅基象限 2026-03-19 16:56 发文

小米大模型MiMo-V2系列卷入市场。

作者 | 张思

来源 | 硅基象限

2026年3月19日凌晨,小米悄然投下一枚重磅炸弹。

在没有大规模发布会、没有预热营销的情况下,小米一次性推出三款自研大模型——MiMo-V2-Pro、MiMo-V2-Omni、MiMo-V2-TTS,业内称之为“三连更”。

这不是一次普通的产品更新,而更像是小米AI战略的阶段性“交卷”:从过去“AI能力嵌入硬件”,转向构建一个完整的Agent时代模型体系。

小米集团创始人兼CEO雷军称其在大模型品牌排行上,已经超过了马斯克的Gork。

这背后,是小米过去两年在大模型领域的低调布局,以及一位关键人物的加入——罗福莉。

罗福莉是95后,本科就读于北京师范大学,硕士毕业于北京大学,毕业后通过阿里巴巴“阿里星”计划加入达摩院,2022年,罗福莉加入Deepseek,成为DeepSeek-V2的关键开发者。

2025年2月确认其入职小米,负责大模型项目,2024年曾有媒体报道雷军以“千万年薪”邀请罗福莉加入。

在入职小米一年后,罗福莉交了一份不错的答卷,MiMo-V2系列发布获得了千问前技术负责人林俊旸等人的祝贺,但对于大模型行业的“晚来者”,小米能否真正在人工智能时代占据一席之地,仍有很多次迭代,和更多不确定性。

小米为何要做大模型?

过去十年,小米已经建立了强大的米家生态帝国,也完成了从从硬件、操作系统再到生态的全链条布局。

在刚刚过去的AWE2026展会上,小米官方透露,截至‌2026年3月‌,小米生态系统全球月活跃用户数达7.42亿‌,AIoT连接设备数‌(不含手机、平板、电脑)10.4亿台,全球开发者数量120万台,米家App月活跃用户超一亿。

从MIUI到小米澎湃OS,小米逐步完成底层软件统一,并在小米汽车发布后,开始拓展“人车家全生态”,构建跨设备协同网络。

但问题在于:生态需要“统一大脑”。

2024年6月13日,小米宣布与字节跳动火山大模型合作,从小米Su7,到从小米智能音箱小爱同学,再到小米生态链的智能设备,都接入了豆包大模型。

但显然,小米不愿意放弃AI的红利,希望依靠自身的强大生态系统,建立自己的AIAgent。“AI进展比外界看到的更快,小米将持续加大投入。“雷军曾表示,希望未来小米在一款终端上实现自研芯片、自研 OS、自研 AI 大模型“大会师”。

传统AI(语音助手、小模型)只能解决单点问题,而不能完成跨设备、跨场景的复杂任务。小米的大模型体系被命名为“MiMo”,其核心定位并非简单对标ChatGPT,而是面向真实世界交互的Agent基础模型。

小米大模型MiMo慢了么?

小米在大模型上的布局比Open AI晚十年,比国产大模型的发布时间也晚了2年。

在2015年,OpenAI成立,当时创始人包括萨姆·奥尔特曼、埃隆·马斯克、彼得·蒂尔。百度AI研究更早可追溯至2012年‌,当年成立深度学习实验室(IDL),由余凯领衔,AI作为百度核心战略方向。

在2023年,随着ChatGPT-4发布,阿里系通义千问,百度文心一言,字节豆包,还有Kimi,DeepSeek等大模型竞相发布,国内开始出现“百模大战”。

小米首次推出大模型MiMo-V1和V2早期版本是在2025年,比国产大模型晚两年。彼时,豆包已日活超过4亿,并成与OPPO、vivo、荣耀、小米、三星、华硕等企业成立了智能终端大模型联盟。

‌小米大模型发力较晚,仍属于“追赶者”状态,只能通过开源策略积累开发者与数据。

在2026年初,一款名为Hunter Alpha在OpenRouter平台爆火,并突然登上全球API调用榜首,调用量突破1万亿Tokens。

业内一度猜测它来自:OpenAI、DeepSeek这样的头部企业,或其他神秘实验室。

最终,小米“认领”。Hunter Alpha 相当于 MiMo-V2-Pro早期版本,这种方式可以用真实调用数据验证能力,在开发者生态中建立声量。

此次,MiMo一口气进行三连更,甚至雷军宣布已经在全球大模型综合智能排行榜上位列全球第八。

MiMo-V2-Pro是万亿参数的“决策大脑”,总参数超 1T,激活参数 42B,最高支持 100 万上下文  Artificial Analysis 里面中文 LLM 第二,仅次于 GLM-5,具备复杂推理、任务规划、工具调用的能力,更关键的是,它具备Agent执行能力,能够自动拆解任务、调用API或工具、完成完整工作流,它可以自动完成数据分析,生成报告,自动编排跨系统操作,类似GPT-4o、Claude Opus、DeepSeek V3的功能,其中,小米强调其API价格仅为Claude同级模型的约1/5,主打性价比。

MiMo-V2-Omni作为全模态Agent引擎,如果说Pro是“大脑”,Omni就是“感知系统”。它支持文本、图像、语音,并且能够跨模态理解复杂环境、自主制定计划并执行、实时调整策略。

MiMo-V2-TTS,目标是让Agent“开口说话”,解决“表达层”问题,支持多语气、多角色语音生成、多方言支持、情感表达与语音风格控制。在技术上, 基于Audio Tokenizer上亿小时语音训练、强化学习优化音色与韵律。

这几个模型会在接下里的一周提供免费试用。

业内人士认为,MiMo-V2可以算进入头部梯队,但不是最强模型,而是“最有差异化路径”的模型之一。如果需要想要最强推理、代码和多模态能力,和ChatGPT这样的通用模型存在差距,在应用层面,没有豆包带来更好的体验,但如果想要低成本+Agent执行 ,MiMo-V2将是不错的选择。

入职一年,小米不再缺席AI

在小米大模型体系中,一个绕不开的人物是——罗福莉。

她是个95后,原DeepSeek核心成员、 北大背景AI研究者,专注大模型与推理系统,她曾被媒体称为“AI天才少女”,但她本人明确表示:“只是一个普通研究者” 。

她在DeepSeek参与核心模型研发,是公司推理导向技术路线的重要参与者之一。DeepSeek强调通过架构优化与工程手段,在相对有限的算力条件下实现高性能模型。

在2025年,罗福莉正式加入小米,担任MiMo大模型负责人,据报道,小米以“千万年薪”引入其负责AI战略核心。

罗福莉在内部将这次发布称为:“从Chat到Agent的范式转变” ,过去的大模型本质是“对话系统”,而MiMo-V2的目标是行动系统(Action System)。ChatGPT时代解决的是回答问题,Agent时代解决的是完成任务。

她的核心观点认为,AI不只是语言模型,而是“理解世界的系统”,算力和数据不是最终护城河,真正的壁垒是研究方法与工程能力。

在今天凌晨5点多,罗福莉在x上发文表示,MiMo-V2是首个真正为智能时代打造的全栈模型系列。

千问前技术负责人林俊旸回复,这是令人钦佩的、激动人心!同时有网友称,其在编码能力上表现不错,在图片识别上与ChatGPT存在差距。

但可以确定的是,小米已经不再“缺席AI战争”,接下来真正的关键,不在于模型参数规模,而在于谁能让AI真正“替用户做事”。

而这,正是MiMo试图回答的问题。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    硅基象限

    上九天揽月,下五洋捉鳖。认真研究...

    推荐商品

      举报文章问题

      ×
      • 营销广告
      • 重复、旧闻
      • 格式问题
      • 低俗
      • 标题夸张
      • 与事实不符
      • 疑似抄袭
      • 我有话要说
      确定 取消

      举报评论问题

      ×
      • 淫秽色情
      • 营销广告
      • 恶意攻击谩骂
      • 我要吐槽
      确定 取消

      用户登录×

      请输入用户名/手机/邮箱

      请输入密码