• 发文
  • 评论
  • 微博
  • 空间
  • 微信

百度李彦宏:这三大AI神器用了人人都是开发者,视觉大模型最大的应用是自动驾驶!

车智 2024-04-17 10:33 发文

北京时间4月16日,百度在深圳宝安会展中心中心召开了Create 2024百度AI开发者大会,这也是百度首次在粤港澳大湾区召开该类型会议,李彦宏也看到了大湾区AI的热情,因为主会场连楼梯都坐满了人,因此不得不停止入场。

当1968年出生,今年56岁的李彦宏出现在台上,这个技术出身的互联网巨头的创始人,面对AI的汹涌浪潮,也在台上说出了“过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言”。

这意味着此前需要培训的编程能力会被弱化,每一个人通过自然语言能力,就可以发挥创造力改变世界。这样的未来,需要强大的基础大模型和低门槛的开发工具。这就是作为技术性公司,百度希望在AI时代提供的能力——一系列强大的基础模型和所需要的开发工具。

百度的基础大模型是发布一年的文心一言,其基座模型是文心大模型,并且在今天发布了4.0的工具版,支持了代码解释器功能,通过自然语言交付就可以处理数据和文件,根据所理解的内容分析,生成图表或者文件,从而为决策提供支持。

在最重要的成本方面,相比一年前的文心一言大模型,4.0版本的算法训练效率提升了5.1倍,推理性能提升105倍、推理成本则下降到原来的1%,这有利于企业和开发者去调用。 

01

三大AI神器、人人用了都是开发者

企业和开发者调用大模型的目的,是为了开发出市场需求的Ai应用,这就有了下面所发布的让人人都能成为开发者的三大神器:AgentBuilder、AppBuilder和ModelBuilder。

1、智能体开发工具:Agent Builder

智能体机制,指的是包括理解、规划、反思和进化,可以让机器像人一样思考和行动,可以自主完成复杂任务,并且能够持续学习、迭代和进化。不同的智能体之间还能互动、协作。

在百度看来,智能体可能是每个人最近、最主流的大模型使用方式。基于强大的基础模型,可以批量生成智能体并且应用在各种各样的场景上。百度提供的智能体开发工具——Agent Builder,可以让每一个商家、每一个客户,在百度的文心智能体平台上,通过Agent Builder,用类似提示词的信息输入和简单的操作,就能迅速生产一个智能体。

百度希望,通过文心智能体平台的分发-诊断-收益的数据飞轮,驱动智能体形成质量更优、流量更好、收益更大的正循环。

2、AI原生应用开发工具:AppBuilder

为了降低开发门槛,百度提供的AppBuilder这款AI原生应用开发工具,提前封装和预置了开发AI原生应用所需要的各种组件和框架。最快可能只需要三步,开发者就可以用自然语言通过AppBuilder开发出一个AI原生应用,并且能够发布、集成到各种各样的业务环境中。

所谓的开发三步就是:第一步、打开AppBuilder,进入创建业务,点击Ai自动生成配置,设置应用的名称、简介、头像等基本信息;第二步、通过自然语言在角色指令中描述具体要求,包括任务、组件能力、要求与限制等;第三步、插入自定义的组件,让这个App拥有具体的服务能力。

3、模型定制工具:ModelBuilder

ModelBuilder是一款更适合专业开发者使用的工具,可以根据开发者的需求,定制任何尺寸的模型,并且根据细分场景对模型进一步精调SFT。掌握模型的精调方法,是开发者用好大模型的重要能力。

ModelBuilder预置了包括ERNIE3.5和ERNIE4.0两个旗舰大模型,以及ERNIE Speed、Lite、Tiny三个轻量级大模型,另外还支持角色扮演的ERNIE Character和适合对话或问答场景的外部工具使用和业务函数调用的ERNIE Functions两个垂直场景的模型。更重要的是,ModelBuilder还支持多达77个国内外第三方主流模型。

为了让更多的开发者使用百度基础大模型和三大开发者神器,百度推出了第二届“文心杯”创业大赛,创业方向是AI原生应用的全球创业创新团队都可以参与,特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。 

02

视觉大模型最大的应用是自动驾驶

李彦宏认为,上述大模型和工具都是语言大模型,但,未来属于多模态大模型,包括文字、图片、语音、视频等多模态的融合,是通往AGI的必经之路。

并且认为,视觉大模型最大的应用场景就是自动驾驶,这可能也是为何李彦宏在前一天会和极越CEO夏一平直播体验极越01纯视觉高阶智驾。

作为在自动驾驶领域起了个大早的百度Apollo,目前业务方向再度聚焦到了量产纯视觉高阶自动驾驶和Robotaxi上。

李彦宏认为,百度在视觉大模型的自动驾驶应用方向上是全球自动驾驶的领导者,不只训练AI生产视频,更训练AI理解真实世界发生的事情并且预测未来,这就是应用在自动驾驶领域。百度基于超过1亿公里、中国复杂城市道路的测试里程数据,训练出了Apollo视觉感知大模型,具备检测、跟踪、理解、建图四大基础能力。

百度地图将视觉感知大模型应用到了制图领域,目前上线了全国360做城市的车道级地图数据,只要有百度地图导航能去的地方,智驾都能开!

在Robotaxi方面,百度的萝卜快跑在武汉实现了长江南北岸的跨越,在武汉部分区域实现了7X24小时的全天候运营,并且计划在年内在武汉部署1000台无人驾驶车辆,覆盖武汉3000多平方公里、770万人口,成为全球范围内规模最大的自动驾驶运营区域。

声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码