百度李彦宏：这三大AI神器用了人人都是开发者，视觉大模型最大的应用是自动驾驶！

北京时间4月16日，百度在深圳宝安会展中心中心召开了Create 2024百度AI开发者大会，这也是百度首次在粤港澳大湾区召开该类型会议，李彦宏也看到了大湾区AI的热情，因为主会场连楼梯都坐满了人，因此不得不停止入场。

当1968年出生，今年56岁的李彦宏出现在台上，这个技术出身的互联网巨头的创始人，面对AI的汹涌浪潮，也在台上说出了“过去，开发者用代码改变世界；未来，自然语言将成为新的通用编程语言”。

这意味着此前需要培训的编程能力会被弱化，每一个人通过自然语言能力，就可以发挥创造力改变世界。这样的未来，需要强大的基础大模型和低门槛的开发工具。这就是作为技术性公司，百度希望在AI时代提供的能力——一系列强大的基础模型和所需要的开发工具。

百度的基础大模型是发布一年的文心一言，其基座模型是文心大模型，并且在今天发布了4.0的工具版，支持了代码解释器功能，通过自然语言交付就可以处理数据和文件，根据所理解的内容分析，生成图表或者文件，从而为决策提供支持。

在最重要的成本方面，相比一年前的文心一言大模型，4.0版本的算法训练效率提升了5.1倍，推理性能提升105倍、推理成本则下降到原来的1%，这有利于企业和开发者去调用。

三大AI神器、人人用了都是开发者

企业和开发者调用大模型的目的，是为了开发出市场需求的Ai应用，这就有了下面所发布的让人人都能成为开发者的三大神器：AgentBuilder、AppBuilder和ModelBuilder。

1、智能体开发工具：Agent Builder

智能体机制，指的是包括理解、规划、反思和进化，可以让机器像人一样思考和行动，可以自主完成复杂任务，并且能够持续学习、迭代和进化。不同的智能体之间还能互动、协作。

在百度看来，智能体可能是每个人最近、最主流的大模型使用方式。基于强大的基础模型，可以批量生成智能体并且应用在各种各样的场景上。百度提供的智能体开发工具——Agent Builder，可以让每一个商家、每一个客户，在百度的文心智能体平台上，通过Agent Builder，用类似提示词的信息输入和简单的操作，就能迅速生产一个智能体。

百度希望，通过文心智能体平台的分发-诊断-收益的数据飞轮，驱动智能体形成质量更优、流量更好、收益更大的正循环。

2、AI原生应用开发工具：AppBuilder

为了降低开发门槛，百度提供的AppBuilder这款AI原生应用开发工具，提前封装和预置了开发AI原生应用所需要的各种组件和框架。最快可能只需要三步，开发者就可以用自然语言通过AppBuilder开发出一个AI原生应用，并且能够发布、集成到各种各样的业务环境中。

所谓的开发三步就是：第一步、打开AppBuilder，进入创建业务，点击Ai自动生成配置，设置应用的名称、简介、头像等基本信息；第二步、通过自然语言在角色指令中描述具体要求，包括任务、组件能力、要求与限制等；第三步、插入自定义的组件，让这个App拥有具体的服务能力。

3、模型定制工具：ModelBuilder

ModelBuilder是一款更适合专业开发者使用的工具，可以根据开发者的需求，定制任何尺寸的模型，并且根据细分场景对模型进一步精调SFT。掌握模型的精调方法，是开发者用好大模型的重要能力。

ModelBuilder预置了包括ERNIE3.5和ERNIE4.0两个旗舰大模型，以及ERNIE Speed、Lite、Tiny三个轻量级大模型，另外还支持角色扮演的ERNIE Character和适合对话或问答场景的外部工具使用和业务函数调用的ERNIE Functions两个垂直场景的模型。更重要的是，ModelBuilder还支持多达77个国内外第三方主流模型。

为了让更多的开发者使用百度基础大模型和三大开发者神器，百度推出了第二届“文心杯”创业大赛，创业方向是AI原生应用的全球创业创新团队都可以参与，特别优秀的项目将有机会获得最高5000万人民币的现金和资源支持。

视觉大模型最大的应用是自动驾驶

李彦宏认为，上述大模型和工具都是语言大模型，但，未来属于多模态大模型，包括文字、图片、语音、视频等多模态的融合，是通往AGI的必经之路。

并且认为，视觉大模型最大的应用场景就是自动驾驶，这可能也是为何李彦宏在前一天会和极越CEO夏一平直播体验极越01纯视觉高阶智驾。

作为在自动驾驶领域起了个大早的百度Apollo，目前业务方向再度聚焦到了量产纯视觉高阶自动驾驶和Robotaxi上。

李彦宏认为，百度在视觉大模型的自动驾驶应用方向上是全球自动驾驶的领导者，不只训练AI生产视频，更训练AI理解真实世界发生的事情并且预测未来，这就是应用在自动驾驶领域。百度基于超过1亿公里、中国复杂城市道路的测试里程数据，训练出了Apollo视觉感知大模型，具备检测、跟踪、理解、建图四大基础能力。

百度地图将视觉感知大模型应用到了制图领域，目前上线了全国360做城市的车道级地图数据，只要有百度地图导航能去的地方，智驾都能开！

在Robotaxi方面，百度的萝卜快跑在武汉实现了长江南北岸的跨越，在武汉部分区域实现了7X24小时的全天候运营，并且计划在年内在武汉部署1000台无人驾驶车辆，覆盖武汉3000多平方公里、770万人口，成为全球范围内规模最大的自动驾驶运营区域。

百度李彦宏：这三大AI神器用了人人都是开发者，视觉大模型最大的应用是自动驾驶！

相关阅读

已认证
车智

车智

举报文章问题

举报评论问题

用户登录×

百度李彦宏：这三大AI神器用了人人都是开发者，视觉大模型最大的应用是自动驾驶！

相关阅读

已认证 车智

车智

举报文章问题

举报评论问题

用户登录×

已认证
车智