• 发文
  • 评论
  • 微博
  • 空间
  • 微信

华为自动驾驶八爪鱼

半导体风向标 2021-05-17 09:23 发文


华为HI发布会纪要

免责声明:本纪要仅供方正证券的客户使用,本公司不会因接收人收到本纪要而视其为本公司的当然客户;会议纪要由方正证券科技团队翻译/整理,可能存在与该公司官方公布的纪要原文/录音有不一致或不准确之处,请投资者以上市公司发布的纪要原文/录音为准;会议纪要内容仅供投资者参考,不包含任何方正证券研究所的投资意见和建议,投资者需自行承担投资决策的风险。

公司名称:HI与您相约2021新品发布会

会议时间:2021年4月18日


在《电车终局》,和《智能汽车终局》深度报告中已经介绍了未来无人驾驶是异构OS操作系统


华为三大计算平台+三大操作系统:


1、智能驾驶计算平台:AOS(智能驾驶操作系统)


2、智能座舱计算平台:HOS(智能座舱操作系统)


3、智能车控计算平台:VOS(智能车控操作系统)


自动驾驶开发有几个挑战,第一个是对海量的数据处理是比较难的,大家以前我们做it,一个企业上云的时候,如果有 t级别的数据觉得是很大了,但是今天的自动驾驶,我们一辆自动驾驶的测试车,一天比如说跑8个小时,数据量都是8t到32t级别的,因为激光点云的数据量实在是太大了,


所以我们一般做自动驾驶都预留了Pb级的空间,甚至有的上PB上10Pb的空间来做自动驾驶,而仅仅是研发阶段,首先是面临的第一个问题,更困难的是这里面海量数据其实真正有价值的数据比例非常低,我们统计可能不到5%。所以怎么从这些海量的数据里面去抽帧去处理,得出真正对我们自动驾驶开发有用的数据,其实是一个非常困难的事情。




第二个,做自动驾驶首先要让机器看得准,那就要教他做感知的识别。数据的标注也是一个非常困难的事情。所以大家一般知道这种自动驾驶企业都要么是自己养了一帮100多人的团队,要么是有专业的外包团队去做人工的标注,所以别人嘲笑说没有人工就没有智能,就靠大量的数据去喂它,把它从一个小孩逐步把它训练到有老司机的水平,所以这个也是难度非常高的。




第三个,我们的仿真的效率比较低。因为自动驾驶测试它会面临很多复杂场景的测试,就是我们说的case,这些空的case里面往往是一些非常危险的场景,比如说鬼探头,比如说车辆的它的cut-in,你想通过真实的场景去模拟,那个是又危险成本又高,仿真场景库的构建能够弥补这些问题。


第四个难度就在于高精地图,因为大家都知道高等级的自动驾驶,它需要用到激光雷达,需要用到高精地图在我们的开发阶段其实是非常容易实现的。因为我去访谈过很多我们在开发阶段的这些我们的做自动驾驶的企业,他都是自己开一辆高等级的自动驾驶的,带有激光雷达数据去采几圈,然后自己制图它就可以满足开发的需求。




但是大家都意识到一个问题,我从我固定的线路扩展到整个城市,扩展到整个中国,这时候怎么办?所以高精地图的整个的标准化,整个的动态的刷新,是一个面临着非常的挑战。所以我们团队在这一年里,其实都主要在考虑两个事情,一个是怎么从开发态变为能商用的状态。


第二个,怎么能使我们自己能做好一个系统,到抽出我们的公共的一个平台技术。我们投了这么多能力做的东西,如果再到另外一个车子的时候,能不能减少这些开发量?所以我们在整个自动驾驶的开发的架构上,我们提出要把硬件数据和算法进行分离。




大家知道我们传统的软件开发,我们做计算机的人都听过是算法加数据结构等于程序。但是自动驾驶的软件它本质上是一个人工智能的应用。人工智能的应用最重要的是三个要素,一个是算力,一个一个是数据,我们认为数据是自动驾驶的核心要素,这里面就包括我们的2D的图像的数据,3的激光点云的数据,还有我们大量的历史标注的这些数据,还有我们测试的场景库的数据,还有我们自动驾驶评测的结果数据,这些数据都是非常海量的多样的。




我们认为这些数据独立出来,将有利于灵活的选择更开放的硬件。因为你的硬件有可能是会变的,而且有可能是多厂商异构的。算法也有可能会变,因为你今天选了自研,明天可能选择a公司的这种算法,后天有可能有一个更强的所以它这个会变,但我认为数据是一个车企自己必须积累的,不会因为以下硬件的变化,上面软件算法公司的变化而变化。


我们通过一些实际的例子来看看我们八爪鱼开放平台,我们最近做了哪些新的特性。首先我们看我们跟诺亚实验室一起在联合合作的。因为感知我们认为是自动驾驶里面技术难度最高的。我们刚开始做的时候啊,其实这个对整个感知的识别准确率其实是存在一些问题的。但是我们经过去年一年的不断的攻关挑战,我们认为目前已经达到了在感知算法的精度上已经达到了业界的水平。




自动驾驶的整个感知算法的在业界有几个比较好的一个公开的数据集,就包括大家熟知的KITTI的数据集,CoCo的数据集,nuScenes的数据集,这些数据集它覆盖范围是比较广的,它走了城市的乡村道路的各种比较有典型代表意义的场景,然后让大家上去去尝试去挑战,看你的识别度,大家可以看到这个上面的照片,




上面照片里面其实上一行是我们在没有优化之前的,这是典型的是一个国外的场景,有人坐在里面喝咖啡,然后边路边有一些广告牌,它就会有一些漏检跟错检的这个情况,然后还有这边图,大家可以看到作为特种车,它其实前面是没有识别出来的,还有远端的车辆,之前也是漏检的。


经过我们工程师的去挑战攻关,最后我们把这些全部去解决了,所以我们是希望通过多算法的模型的调整,能够解决这些感知识别里面的新人的漏检、错检,特种车辆漏检这些业界难题。我后面会请我的博士团队的同事来介绍他是如何做到的。



第二个,刚才说的比较困难的是我们的仿真,仿真里面首先是软件的仿真,大家可以看到仿真,对。最边上那个是我们真实的录采的一些画面。然后下面一个是我们感知的画面,然后这边最大的一个屏幕是我们八爪鱼里面仿真出来的画面,大家能看到这个比较熟悉的知道这是武汉的光谷广场的场景,它整个的仿真度啊还是非常逼真的。所以通过我们与高精地图的结合,能够实现复杂场景的数字孪生的分钟级的构建。



这样我们在做实际的我们叫软件在环测试的时候,就可以实现多种场景的快速的构建,自己可以添加很多场景行人,还有我们的旁边的大量车.这些可以实际的软件的去编程仿真,很好的去支撑这个软件在环的私有测试,一个场景就是我们软件做完的私有的软件在环的测试之后,其实我们还要上真实的车,所以大家可以看到其实我们是在华为园区里面真实的车在做这个测试,


但其实真实的场景里面是没有构筑真的是行人的插入还有固定障碍物是没有的,但是我们在软件里面可以插入这些环节,不用真人去测试,或者是一些构筑场景,通过云端的 测试能够很好的去力解决场景段落的问题,还能解决我们跟车辆实行的车辆动力学的联动,更真实的去验证。




我们考虑自动驾驶从开发到商用,其实这里面技术难度是完全不一样的,我们在做开发的时候,我们往往可以在我们自己开发实验室的旁边搭一个小数据中心,然后去解决这些数据处理接入的问题,但是真正要走向商用的话,这里面对数据的支持是非常大的挑战。


最近大家都知道我们国家发布了智能网联汽车生产企业的产品准入的管理指南,其实那里面对数据的合规安全隐私提出了非常高的要求。因为大家知道我们高等级的自动驾驶,他的整个的触角他跑过一圈之后,他把这些数据连起来,其实它就是做一个高精度的地图的采集。



这些都对整个数据的要安全的要求,隐私的要求提出了非常高的挑战。所以从我们多年的 的经验来看,随着自动驾驶数据量的增加,承载数据的数据中心架构会变得非常复杂。所以我们认为传统的数据中心的模式已经不能够适应自动驾驶的商业化的要求。所以上云可能是自动驾驶从开发到商用的一个必由的道路。



所以大家可以看到我们华为的八爪鱼是构建在我们华为云的底座基础之上的,华为云在全球有23个大的 region,有2500多个节点,因为我们的整个的手机业务,我们的企业业务,我们在全球各地中国都需要接入我们的云服务,所以这个能保证我们的未来的智能汽车在整个中国大地跑的时候,你上传的 case还有整个云端的服务连续性是完全没有问题的,所以我们希望就是说自动驾驶的开发者随着数据量的增大,将不会再为机房的专线升级扩容伤脑筋,他可以把精力全部放在自己的核心算法的开发上面。



所以我今天我非常高兴能不能我们发布华为的八爪鱼的自动驾驶的开放平台,希望帮助我们的车企构建以数据为中心的自动驾驶的闭环的系统。我们将复杂变得更简单,所以我们平台有三个能力,首先我们把这个算力、数据、算法是给结果的,我们实现了车云的协同。同时我们的算力的平台,既可以支持华为的mdc,也可以支持我们其他主流的像英伟达等我们主流的硬件。同时我们的高精地图也是解耦的,我们不仅仅可以使用华为的高精,地图我们也可以所有支持这个标准的像NDS格式open drive等这种主流的高精地图的标准我们都是可以支持的。


所以我们希望能够做成把整个的开放平台提供出来,然后八爪鱼里面我们会预制了2000万个宽的已经标好的标准数据集,还有20万个场景库数据,还有我们的场景的数字孪生,虚实的混合的仿真,日行1000万公里的仿真的服务,所以真正能做到云服务的开箱即用的这么一个优势。


然后各位领导各位嘉宾非常荣幸给大家介绍一下我们华为八爪鱼的这样一个技术特性,刚才廖总也给大家介绍了,那么我们这个平台首先它的目的是为了帮助我们的车企和我们增加的开发者加速算法开发的迭代以及应用。那么我们这个平台首先是全面的覆盖了自动驾驶开发的各个阶段,大概给大家简单的介绍一下。


那么我们首先有数据服务,那么我们可以承接异构的硬件,当然包括我们华为的产品,我们的ADC我们的IRS的产品,是吧?那么我们可以把激光点云把我们的高精度的GPS视觉能够通过不同的方式传输到我们的云上来。


比如说在我们的开发阶段,我们可能有大量的整体的数据,我们通过硬盘快递这样一个方式把它传到我们的机房,那么在商业化的阶段,我们可能就只能用5G4G这样的一个方式,然后把我们的增量化的数据传到我的云上来,那么这中间刚才廖总已经强调了,我们非常强调的是数据的能力,数据的质量以及挖掘,所以待会给大家具体介绍一下我们在这方面做的一些工作。


那么在数据上云之后,我们就可以利用云上的海量的资源,比如说对于感知的算法做人工智能这一块都很熟悉,那么可以有训练的服务,提供并发的快速的算法的迭代,自动的参数调整,自动的评测,那么对于规划控制算法就是增加使用另外一个很大的模块,那么刚才廖总也讲了,我们主要是依靠两种仿真的方式,一种是虚拟仿真,那么另外一种就是回放式仿真,应对于不同阶段的增加是很好的开发,最后在车辆上路了之后,我们还是提供了监管的服务。


比方说车厂能够快速的收集车辆的数据,进行算法的迭代,然后通过OTA下发更新,这样让这个车越开越聪明。我们除了这是一个全面的一站式的平台之外,那么我们想强调我们这是一个开放的品牌,我们是支持各种各样的API调用以及数据的接口,跟我们合作伙伴一起这市场进行二次开发。


所以下面给大家具体的介绍一下,我们这里技术上面我们也做了一些突破性的发展。那么第一个技术特性,我们人工智能开发者他可能都是面对这样一个困境,就是有多少人工就有多少智能是吧?那么这里面大部分的人工是在数据的收集清洗以及标注上面,尤其是跟自动驾驶相关的计算机视觉方面的研究,我本人是做这个领域做了很多年。


那么标注数据可能占到一个工程师大概80%的时间,那么这个相当是不合算的,就是非常靠大量的劳动力来堆积。比如说我们看到的后面的激光点云的照片,如果是我们对其中的比如车辆进行标注,那么画一个正确的三维的框框住这个车一般来说需要大概60秒的时间,那么运用了我们的算法之后,我们把它降到了5秒左右,所以这是一个10倍以上的提升。


那么具体我们怎么做,这个是依靠我们华为公司 AI能力的一个积累。大家可以看到这是我们其中一个深度学习的网络。那么它非常的复杂,主要是用来就是做三维点云的检测,它是跑在云端的,它可以就是说不受实时性的限制。


给大家简单介绍一下我们具体做了些什么事,首先就是说我们有激光点云和图像,我们把它配准以后,可以做一个多模态的融合,就点云图片可以做一个融合。那么对于点云本身我们还可以做一个不同视角的融合,一个Bev Review就是上帝视角的,还有一个就是说range,就是说正面看过去的,那么最后我们还可以做一个多任务的融合,我们让这个任务不光是做一个框的检测,


那么也做了一个物体的分割,这样的话更加好的提升它的那个能力。那么这样一个复杂的模型应该说它的训练还是非常困难的,我们底下列了一下这个模型,我们大概需要200万以上的数据.一般的情况下,如果在一个自动驾驶的公司或者是一个比较初期的团队,可能大家会用一个比如说伊巴卡的服务器,这个已经是比较强悍,


但是大的模型大概要花三周21天以上,那么在云端我们可以不断地调用我们已有的GPU的资源,那么这200以上GPU比如我们一天时间就可以迭代,那么这个工程它就可以不断的调整算法优化算法。那么刚才谈到了我们有自动标注的算法以后,我们很快的可以累积我们这个数据的数量对吧?但是另外一个层面上我们要提数据的质量是非常关键的。


我们可能分析了一下,大概只有5%或者更少的数据是真正感兴趣的,我们派我们采集车出去路采的时候,可能往往发现了都是说一个空旷的道路前面有几辆车,那么对于大部分的算法来说,这个都是没有什么困难的,我们要找的是一些所谓的qualities就是能力,还有就是一些长尾问题。


所以我们举一个例子,就是大家在后面看到了,我们在国内的场景经常见到的有这种小的三轮车,他们是异形的各种各样的都有,其实它的速度也不算慢,它的形状又跟一般的车不太一样,所以一般是检测里面比较难的。那么我们在这里提出一个算法,就是说通过云端和车端这样一个算力的结合,我们跟我们的MDC一起配合,通过在云端能够直接把这些图片或者我们的点直接把它的特征抽取出来,把它推送到我们的车端,这样的话我们的车在自己开的时候,它就不会说是无意义的收集那些比较简单的数据,它就会找跟我们想要的图片比较相似的。


那么我们的工程师可以找一幅图,比如说我们测试的时候发现好像三轮车我们检测的不是很稳定是吧?那么可以在我们自己数据库或者在网络上随便找一张图片,那么画一个框,然后我们通过云端推送到我们车端上去,我们车端的算法同时就会对他现在已有的同时还在做各种各样的测试,或者是验证都没有关系,要么是影子模式也可以,那么它可以自动搜索跟相似的,


这样的话它就把它的图片待会大家看到就可以抽取到云上来了,那么通过这样一个手段,我们可以智能化的,而且是快速的构建我们自己的数据集,又解决了之前我们数据传输和存储的很大的问题,我们预测这个方法我们可以大概减少70%的在路测收集数据的时间,那么能够减少90%的上云的数据量,这样的话我们也可以就是说让我们的车队无论是在研发阶段还是在量产阶段,它都可以主动的成为我们收集数据的一个工具。


那么刚才我们谈的主要是在感知检测这个层面上,接下来给大家再稍微介绍一下我们在规划控制以及仿真这个领域的一些个进展。我们在云端一个比较重要的这个优势,就是我们可以进行大规模并发的仿真,不是简单的大家想的好像堆砌硬件就可以了,因为它在硬件很多情况下需要有一个负载的均衡,并发的优化,那么我们是解决了这样一个问题才能达到现在我们说是每天可以进行虚拟仿真,大概到1000万公里以上,那么我们知道一个比较鲁棒的这样一个增加的系统,它至少恐怕在虚拟里面要做10亿级以上的这样一个仿真。


那么除此之外,我们在仿真结束以后,也可以对仿真结果进行评测,我们要知道它的好还是坏,现在我们是大概内置了200个以上的常见的评测标准,比如说是否遵守交通规则,是否与其他交通责任者过境。我们现在是内置了200个,那么我们也允许我们的合作伙伴开发他们自己的一些个评测指标。那么最终有这样一个自动化评测的体系以后,我们就可以把我们整个开发的流程纳入到我们现在非常流行的开发手段。


简单的讲就是我们的工程师他在白天的时候只要做算法的调测工作,那么晚上下班之前他就可以将它的代码入库进行云上的编译,我们自动的进行代码的管理,如此那么自动的去跑这些仿真的结果,这些结果反馈给他,第二天他回来的时候就可以看到昨天我的改进到底有没有生效,是不是让我的想法更稳定,会有一些量化的指标。那么这样的话我们就可以使我们算法开发的节奏,从之前自己要手动的做这些工作,大概是好几天才能看到一个结果,压缩到大概小时级,那么对于版本的发布来说,也是从我们大概几周可以缩减到大概几天,这样极大的就是加快了我们算法迭代的一个速度。


我最后还需要重要的发布一个跟大家比较关注的就是我们的高新地图的方案,高精地图的云服务。最近大家讨论比较多的,就是说你在一个指定的区域能做得很好,当你未来要向全国更多的地方去拓展的时候,高精地图的问题怎么解决?所以我今天非常高兴的给大家发布我们华为在高清地图领域的我们的云服务,我们的特性跟目标。


所以我们现在华为已经拥有了我们的导航电子地图的甲级的测绘资质,同时我们已经也有了完整的高精,地图的采集跟制图的能力。所以我们在高精地图的精度,还有我们的广度鲜度,还有我们知识的应用上,我们有信心在今年能支持真正的商业化,商业化。所以我们在整个的精度上,我们不单单要保证我们通常的道路的进度,


我们还要保证我们在在一些比如说在一些高速的有一些遮挡的地方,还有我们的,城市的一些峡谷等这种特殊的工况的场景,也要保证它的相对的精度跟绝对的精度的一致。另外一个就是我们在覆盖度上,我们今年会发布我们全国的高快速路和我们北上广深一线城市,然后到明年我们预计会加8个城市,然后到后面我们预计是20个城市。当然我觉得因为我们考虑到中国服务员非常辽阔,


城市众多,其实我们现在不单是华为自己在采购制图,我们也正在广泛的合作,我们的服务商在一起合作,我们是希望制定共同的中国高精地图的标准,然后能共同的绘制出一张中国的高精地图。所以我相信随着我们自动驾驶进程的加速,我们这张中国的统一的一张高精地图,高质量的高精地图,我觉得会更快的建立起来,更快的去点亮中国的各个城市。


声明:本文为OFweek维科号作者发布,不代表OFweek维科号立场。如有侵权或其他问题,请及时联系我们举报。
2
评论

评论

    相关阅读

    暂无数据

    半导体风向标

    专注半导体产业链研究,挖掘国产化...

    举报文章问题

    ×
    • 营销广告
    • 重复、旧闻
    • 格式问题
    • 低俗
    • 标题夸张
    • 与事实不符
    • 疑似抄袭
    • 我有话要说
    确定 取消

    举报评论问题

    ×
    • 淫秽色情
    • 营销广告
    • 恶意攻击谩骂
    • 我要吐槽
    确定 取消

    用户登录×

    请输入用户名/手机/邮箱

    请输入密码