《北京市关于建设数据要素综合试验区的实施意见(征求意见稿)》近日公布,指出北京经开区围绕智慧城市和智能网联汽车“双智融合”,打造智慧城市综合应用示范。在此背景下,如何挖掘数据“金矿”,推动产业数据高效流通应用?目前,北京市高级别自动驾驶示范区(以下简称“示范区”)已汇聚海量车路云一体化数据资源,其中结构化数据相当于18.7万本新华字典,非结构化数据相当于4.3万部高清电影。作为示范区专项运营平台和北京经开区企业,依托自动驾驶可信数据空间,北京车网科技发展有限公司(以下简称“北京车网”)正式面向“双智”数据供给方、需求方与服务方开放生态伙伴招募,合规推动产业数据价值释放。
海量真实
产业数据价值初步显现
数据资源就像埋在地下的金矿,不开发就永远只是石头。北京车网数据产品研发相关负责人表示:“我们在支撑示范区车路云一体化建设运营过程中,不断积累标准化的管理运营模式与产业高质量数据,在此基础上,积极响应示范区相关管理部门、企业及科研机构的需求去开发相关数据资源。”
目前,示范区已完成1.0、2.0、3.0阶段建设,建成城市级工程试验平台,实现600平方公里设施智能化部署,累计汇聚多源数据超7PB。海量、多模态、高精度,是这些数据资源的特点,示范区自成立以来,持续采集自动驾驶车辆运行状态数据、车载视频、路侧视频及点云、路侧感知结果数据、交通流量指标等数据资源,目前已汇聚超1000辆的自动驾驶车辆监管数据,1600余个路口全息感知数据,全域覆盖的高精度地图数据,以及智慧城市、智慧交通相关第三方平台数据。
基于此,北京车网已挖掘出多个“数据金块”,包括Dair V2X数据集、感知专项数据集、预训练数据集、异常事件数据集,以及危险工况场景库。例如,免费公开的公共数据集Dair V2X主要服务车路协同3D目标检测、车路协同时序感知和车路协同轨迹预测,累计下载量近4万次;自动驾驶危险工况及事故场景库已在北京国际大数据交易所、西部数据交易中心、阿里云云市场等多平台上线,通过对示范区监管数据中的风险性自动驾驶运行数据进行挖掘分析和场景还原,支撑自动驾驶企业开展自动驾驶算法训练和测试验证。
降本增效
面向产业与社会转型升级
“这些数据产品能在产业创新与政府管理多领域大显身手。”该负责人介绍,北京车网打造的数据产品具体可应用于智慧城市和交通管理、辅助驾驶及自动驾驶、物流和出行平台、地图服务、保险金融、高校科研等领域,通过赋能智慧城市交通的精细化治理与自动驾驶技术和服务的迭代,综合提升公众出行体验感和获得感。
面向自动驾驶领域,这些数据产品就像车辆的“驾校题库”。当前,自动驾驶行业面临仿真数据和真实路况差距大、算法泛化能力不足等问题,北京车网的数据集和场景库等产品能提供海量真实数据,助力AI学习真实路况、让车企降本增效。以示范区当前最大规模数据集预训练数据集为例,它拥有车端、路侧双重视角,包含经过脱敏标注的超50万帧图片与超10万条动态工况视频。针对车辆目标识别,应用数据集里几万帧特殊车辆等图片训练后,识别的准确率能从以往70%提升到90%以上。
对智慧交通来说,车路云一体化数据产品能训练“智慧管理大脑”,通过获得每个交通参与者连续、高频的行驶轨迹点,提升交通精细化水平。该负责人说:“当前,北京经开区也在利用车路云一体化数据去赋能信控优化,最终实现绿波通行,有效缓解了区内的交通拥堵问题。随着示范区向北京市更多区域拓展,车路云一体化数据资源开发模式也能够分享给更多区域,将‘亦庄经验’因地制宜进行推广。”
开放合作
招募数据生态伙伴
依托自动驾驶可信数据空间领先的技术保障与政策试验环境以及示范区超7PB海量数据资源,北京车网广发“英雄帖”,携手生态伙伴共掘数据“金矿”。
“我们将面向相关政府管理部门、车企等数据需求方,数据标注企业、算力平台等数据服务方,以及数据提供方开放合作。”该负责人表示。北京车网将为需求方和运营方,提供规范的车路云网图数据和更多的行业数据生态资源,为数据服务方带来更多服务机会,为数据提供方提供合规、可信的数据供给渠道,实现多方共赢。
数据流通应用以安全可信为前提。近三年来,北京车网持续支撑示范区构建起“管理+技术”的双重数据安全保障,让数据资源在“上锁”保障下“开放”。一方面,在示范区数据安全管理体系指导下,北京车网参与发布了《车路云一体化系统数据分类分级指南》团体标准,以及全国首个面向测试示范区的数据分类分级白皮书,为数据安全管理提供范本;另一方面,北京车网也自主研发了数据脱敏系统,开展数据加密传输与存储,并依托数据流通监管沙盒合规机制保障,实现可信数据即取即用。
作为北京亦庄促进智能网联汽车高质量发展的重要领域之一,此次北京车网数据开放将加速“双智融合”的落地。接下来,北京车网将与产业各方共建车路云一体化数据要素生态圈,释放数据开放合作的乘数效应,为数字经济的发展贡献“亦庄智慧”。