问答媒体

 找回密码
 立即注册
快捷导航
搜索
热搜: 活动 交友 discuz
查看: 94|回复: 1

百度Apollo刘健皓:数据闭环合规,驱动自动驾驶产业安全发展

[复制链接]

2

主题

10

帖子

17

积分

新手上路

Rank: 1

积分
17
发表于 2023-1-8 15:12:20 | 显示全部楼层 |阅读模式
2022年12月22-23日,由亿欧汽车主办的GTM2022全球科技出行峰会在中国上海成功举办。本届峰会以“加速·定势”为主题,聚焦时下热议的智能电动汽车(SEV)发展,围绕六大主题论坛,携手与会的数十名行业头部企业高管,呈现了一场新技术与新理念齐驱的汽车出行产业年度盛会。
在12月23日下午召开的《自动驾驶场景商业化展望论坛》上,百度Apollo信息安全负责人刘健皓发表了以《数据闭环合规,驱动自动驾驶产业安全发展》为题的演讲。他在演讲中表示:
1.自动驾驶汽车数据闭环的挑战分为三方面,分别是数据确权、数据防护和数据流通。
2.百度通过一个中心、三重防护来管控数据闭环全生命周期安全,全面保障地理信息数据安全。通过全栈自研的自动驾驶技术能力,为自动驾驶研发落地。应用量产保驾护航。
3.自动驾驶商业化是大势所趋,但合规风险不容忽视。在商业化的背后,自动驾驶产业还需要做好数据闭环,并获得用户的正向反馈,来不断驱动商业闭环。
以下为分享实录,供行业人士参考:
各位在场观众,大家下午好!
我是百度Apollo信息安全负责人,我叫刘健皓。今天给大家分享的议题是《数据闭环合规,驱动自动驾驶产业安全发展》。
我们这个环节主要是讨论自动驾驶的商业化,以及商业化的背后的合规性问题。
自动驾驶需要通过量产车采集问题数据去解决自动驾驶长尾问题,让自动驾驶越用越智能。但自动驾驶汽车数据采集的合规性也备受监管部门关注。今天,我就来谈谈怎样满足自动驾驶数据采集合规要求,促进商业化发展。
自动驾驶汽车到底有哪些数据闭环?到底要采集哪些数据?里面会有什么样的风险?
自动驾驶的技术路线分为纯视觉和高精定位+地图两条路线,分别是面向L2、L3和面向L4、L5对应的路线。在这两条路线的过程中,会涉及到两类数据闭环:
第一类数据闭环是基于视觉的自动驾驶要对车外环境的数据进行采集,回传到云进行自动驾驶模型的训练,这类闭环我们称之为自动驾驶训练闭环;
第二类数据闭环是基于激光雷达+高精度地图的自动驾驶系统,实际上是要感知地图的变化情况,对高精度地图进行增量更新,保证地图的新鲜度,这类闭环我们称之为高精度地图更新闭环。
这两种闭环都需要车外传感器采集周围环境地面物体以上的环境类数据。这些数据包括视频、点云、图像,还有其他位置信息数据。这些数据都属于测绘数据。自动驾驶汽车在运行、道路测试都属于测绘行为。
所以说,满足数据闭环合规性,是要在保证地理信息安全的前提下。通过保护地理信息数据的安全来促进自动驾驶产业发展。
自动驾驶汽车数据闭环合规的挑战分为三方面:
第一,数据确权。在自动驾驶数据闭环采集过程中,有很多数据所有权都不是特别清晰。比如说车企认为自动驾驶汽车采集的数据,数据的所有权就归车企所有。但是在数据的分类分级过程中,可能车外的环境数据中存在涉及国家安全的重要数据,可能所属权不一定由车企所有。车外数据里也包含人脸、车牌等,本身就是个人信息相关,数据所有权也不一定归车企。所以在数据确权的方面目前很难实现权属明晰,责任清晰。
第二,数据防护。在数据闭环过程中会涉及到地理信息,这些数据是结构化,还有一些是非结构化的数据,传统的数据安全防护手段不适用于新型的,庞大的数据,对于这些数据全生命周期的防护,也是非常大的挑战。
第三,数据流通。数据在流通过程中,会出现数据权力的不停转换,从而会带来数据所有者权属不明、数据滥用以及数据安全监督管理责任不明晰等安全风险,将严重损害数据所有者的权益。
同样相关监管部门也发现了痛点和问题。所以,在今年8月30日,自然资源部出台了管理规定,在《中华人民共和国测绘法》的背景下针对现在的自动驾驶汽车的数据采集的行为、主体、资质进行了进一步的明确。
首先是明确了什么是测绘行为:
规定指出智能网联汽车安装或集成了卫星导航定位接收模块、惯性测量单元、摄像头、激光雷达等传感器后,在运行、服务和道路测试过程中对车辆及周边道路设施空间坐标、影像、点云及其属性信息等测绘地理信息数据进行采集、存储、传输和处理的行为,属于《中华人民共和国测绘法》规定的测绘活动,应当依照测绘法律法规政策进行规范和管理。
其次是明确了测绘主体:
对智能网联汽车运行、服务和道路测试过程中产生的空间坐标、影像、点云及其属性信息等测绘地理信息数据进行收集、存储、传输和处理者,是测绘活动的行为主体,从当前市场运行的情况看,数据的收集、存储、传输和处理者大多为车企、服务商及部分智能驾驶软件提供商
最后是明确了测绘资质使用要求:
测绘主体行使测绘行为的时候必须要有测绘资质,这就要求大部分自主品牌的OEM,要么自己申请测绘资质,要么委托一个有测绘资质的厂商去处理测绘数据。这是对于自主品牌的OEM。
对于外资OEM,因为测绘资质的背景,所以不允许外资厂商申请测绘资质,只能委托对应的图商进行测绘行为。
百度是既懂自动驾驶,又有测绘资质的厂商。所以,百度自动驾驶云联合百度智图推出了自动驾驶数据闭环合规服务,帮助各个OEM合规合理地采集道路数据,帮助推进自动驾驶数据闭环训练,促进量产车的数据迭代,实现自动驾驶能力的迭代。
整体合规思路是什么呢?这也是我们根据测绘行业相关的管理规定总结的一个思路,叫“原始数据不出车、测绘数据不出云、测绘成果不关联、资质图商全管控”。
原始数据不出车:要求在车端内部对原始数据做相应的商密加密和数据脱敏、坐标偏转,保证车上采集的原始数据不出车,而是经过合规、保密处理以后,通过双向认证和加密传输的链路,传输到云端。
测绘数据不出云:当图商需要处理这些数据的时候,需要从安全存储区域把数据导到图商作业区,再进行数据解密和脱密,把测绘数据处理好,变成非测绘类数据,再给到自动驾驶厂商进行训练,在整个过程中,测绘数据是不能够通过外发的形式离开图商监管的专有云。
测绘成果不关联:自动驾驶厂商或者OEM拿到图商给的非测绘数据后,不能使用相关手段将非测绘数据通过某种关联关系,对数据加工形成测绘成果。
最后在自动驾驶数据采集、传输、存储、加工、使用的全生命周期过程中都应由有资质的图商进行数据的管控。
因为管理规定要求在图商的管控下进行数据采集、传输、存储、使用、加工等全生命周期流程。
所以,百度推出了“一个中心,三重防护”的概念,来管控数据闭环全生命周期安全,全面保障地理信息数据安全。
一个中心,是以图商安全管控为中心,目的是保障测绘数据的内容安全,保障测绘数据不会外泄。
三重防护:
一是要求自动驾驶工具链合规,保证汽车数据在应用过程的安全,涉及点云抽帧、图像脱敏、可控标注等技术;
二是保护数据自身的安全防护,通过加密、身份校验和其他一些安全审计措施,保证数据防护的安全;
三是通过基础设施安全,保证汽车数据在运行环境里安全,包括容器防护、安全存储、边界隔离等技术。
展开说一下:
第一,大部分自动驾驶工具链加工数据的时候,并没有考虑到安全的因素。所以,我们要求自动驾驶在训练和加工的时候也需要有一些安全手段来保证我们不会把相关的非测绘类数据通过时间戳、位置信息的关联信息把它关联成测绘数据,形成测绘成果。这对于自动驾驶的工具链会有一些安全要求。
第二,百度建立了一套以商密算法为核心的数据保护机制,以保障地理信息的自主可控。由图商建立密钥中心作为可信根,对自动驾驶训练数据流通过程中的关键过程进行加、解密,并且对加、解密过程进行授权审计,形成一条可信链,保证自动驾驶数据、地理信息数据在自动驾驶训练闭环流通过程中的安全性。通过商用密码、可信根和可信链把它紧紧地管控起来。
第三,在自动驾驶数据上云或传输到保密机房时,要对数据安全存储的环境、数据的审计、容器的防护和边界的安全进行防护,保障地理信息数据在存储和运行环境的安全。一方面是防止黑客攻击可能造成的数据泄露,另一方面是防止在数据处理过程中有第三方人员或内鬼把数据给带走,造成数据泄露风险。
百度在自动驾驶数据闭环的过程中,能够为OEM提供全栈自动驾驶方案。这些方案主要涉及三方面:
一是全流程。从技术能力覆盖数据采集、存储、标注、训练、仿真等全流程管理。
二是全面合规。因为地理信息数据安全只是自然资源部的要求,未来可能还有个人信息、车辆数据安全以满足工信部、网信办等其他部位的安全监管和要求。
三是全场景。前面说了那么多安全,实际上都是为了自动驾驶的闭环。从自动驾驶研发到量产商业化的路径分为三个闭环。
第一个闭环是自动驾驶研发闭环,即自动驾驶从0到1的研发阶段,使用的是采集车采集周边数据进行自动驾驶算法和模型的研发。这时使用的是数据采集车,采集的是丰富的、海量的、全面的数据,去迭代算法、训练模型,让自动驾驶能力能够更快的上路应用。
第二个闭环是自动驾驶运营闭环。在自动驾驶能力落地量产之后,需要面向量产车解决在研发场景以外的长尾问题,自动驾驶汽车在路面上行驶时会碰到各种Corner case这些在用户端收集到的真实反馈能够有效的迭代自动驾驶模型的成熟度,让智能汽车越用越智能,如果说没有运营闭环,没有量产的车,是不会产生规模化效应,不会让自动驾驶的能力产生爆发式增长。
第三个闭环,是大家最关注的商业化闭环。很多新势力智能汽车的车价会很低,靠后期自动驾驶服务订阅和收入来提高自己的收入。卖车不会成为一锤子买卖,后面会通过自动驾驶服务的订阅,提供能高等级的自动驾驶,产生商业闭环。所以说,数据合规也是为商业闭环打造相应的场景。这样才能让自动驾驶技术落地量产,并且进行商业化。
在我们内部会把自动驾驶分为两个大的阶段:一是本身功能的研发测试;二是量产迭代阶段。
我们在路上已经有量产车在收集corner cases,并通过网络回传、数据托管服务更新到自动驾驶训练平台上做量产迭代。如果没有量产迭代,就绝对不会有自动驾驶能力“质”的飞跃和“质”的提升。后续,百度会推出自动驾驶云2.0来适应自动驾驶量产的数据闭环和迭代。
最后,说了那么多合规,到底哪里合规?怎么合规?
百度在自动驾驶研发的过程中,包括Robotaxi、ANP、AVP、Robobus等,所有自动驾驶车辆每一步研发过程都得踩在合规的点上。如果有一点不合规,很有可能面临监管部门的处罚。
在这一路下来,我们积累了大量安全的资质,保证我们合规性,包括导航电子地图甲级测绘资质等。我们的自动驾驶云通过了公安部的信息安全等级保护三级的要求,还有网信办和工信部的认可。
同时光有合规资质,没有合规的落地能力是不行的。我们积累了网络安全和功能安全的应用落地能力支持合规业务的安全落地,并获得ISO21434和ISO26262的认证,证明我们能把合规的能力落地在车上进行规模化应用。这些资质就是最好的考量和结果。
在座的不少人都是为了自动驾驶商业化而来。在商业化的背后需要数据闭环得到用户的正向反馈,不断驱动商业闭环。自动驾驶商业化是大势所趋,但数据闭环的背后也有很多合规风险,针对于合规风险不容忽视。
这就是我的介绍。谢谢大家!
回复

使用道具 举报

0

主题

8

帖子

12

积分

新手上路

Rank: 1

积分
12
发表于 2025-5-18 13:44:15 | 显示全部楼层
好帖必须得顶起
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver| 手机版| 小黑屋| 问答媒体

GMT+8, 2025-7-18 08:07 , Processed in 0.080725 second(s), 22 queries .

Powered by Discuz! X3.4

Copyright © 2020, LianLian.

快速回复 返回顶部 返回列表