• 发文
  • 评论
  • 微博
  • 空间
  • 微信

大模型视觉测评榜单出炉:Gemini遥遥领先 豆包冲进前三

快科技 2025-12-31 14:14 发文

快科技12月31日消息,近日,SuperCLUE-VLM多模态视觉语言基准测评12月总榜公布。

谷歌的Gemini-3-pro以83.64分遥遥领先,字节跳动的豆包大模型以73.15分跻身前三,展现出国内大模型的竞争力。

此次测评从基础认知、视觉推理、视觉应用三个维度对多模态大模型进行评估。

榜首Gemini-3-pro在三项细分指标中均表现突出,基础认知得分89.01、视觉推理82.82、视觉应用79.09,全面领先其他模型。

国内阵营中,商汤科技SenseNova V6.5 Pro以75.35分位居第二,字节跳动的豆包视觉版紧随其后,其基础认知得分82.70,甚至超过部分国际竞品,仅在视觉推理环节稍显短板。

百度ERNIE-5.0-Preview、阿里巴巴Qwen3-vl等国内模型也进入前五,其中Qwen3-vl是榜单中首个开源且总分超70的模型。

国际头部模型中,Anthropic的Claude-opus-4-5得分71.44,OpenAI的GPT-5.2(high)仅获69.16分,排名相对靠后。

作者:随心来源:快科技

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    快科技

    快科技是中国具影响力的泛科技领域...

    推荐商品

      举报文章问题

      ×
      • 营销广告
      • 重复、旧闻
      • 格式问题
      • 低俗
      • 标题夸张
      • 与事实不符
      • 疑似抄袭
      • 我有话要说
      确定 取消

      举报评论问题

      ×
      • 淫秽色情
      • 营销广告
      • 恶意攻击谩骂
      • 我要吐槽
      确定 取消

      用户登录×

      请输入用户名/手机/邮箱

      请输入密码