《北京市關於建設數據要素綜合試驗區的實施意見(徵求意見稿)》近日公佈,指出北京經開區圍繞智慧城市和智慧網聯汽車“雙智融合”,打造智慧城市綜合應用示範。在此背景下,如何挖掘數據“金礦”,推動産業數據高效流通應用?目前,北京市高級別自動駕駛示範區(以下簡稱“示範區”)已匯聚海量車路雲一體化數據資源,其中結構化數據相當於18.7萬本新華字典,非結構化數據相當於4.3萬部高清電影。作為示範區專項運營平臺和北京經開區企業,依託自動駕駛可信數據空間,北京車網科技發展有限公司(以下簡稱“北京車網”)正式面向“雙智”數據供給方、需求方與服務方開放生態夥伴招募,合規推動産業數據價值釋放。
海量真實
産業數據價值初步顯現
數據資源就像埋在地下的金礦,不開發就永遠只是石頭。北京車網數據産品研發相關負責人表示:“我們在支撐示範區車路雲一體化建設運營過程中,不斷積累標準化的管理運營模式與産業高品質數據,在此基礎上,積極響應示範區相關管理部門、企業及科研機構的需求去開發相關數據資源。”
目前,示範區已完成1.0、2.0、3.0階段建設,建成城市級工程試驗平臺,實現600平方公里設施智慧化部署,累計匯聚多源數據超7PB。海量、多模態、高精度,是這些數據資源的特點,示範區自成立以來,持續採集自動駕駛車輛運作狀態數據、車載視頻、路側視頻及點雲、路側感知結果數據、交通流量指標等數據資源,目前已匯聚超1000輛的自動駕駛車輛監管數據,1600余個路口全息感知數據,全域覆蓋的高精度地圖數據,以及智慧城市、智慧交通相關第三方平臺數據。
基於此,北京車網已挖掘出多個“數據金塊”,包括Dair V2X數據集、感知專項數據集、預訓練數據集、異常事件數據集,以及危險工況場景庫。例如,免費公開的公共數據集Dair V2X主要服務車路協同3D目標檢測、車路協同時序感知和車路協同軌跡預測,累計下載量近4萬次;自動駕駛危險工況及事故場景庫已在北京國際大數據交易所、西部數據交易中心、阿裏云云市場等多平臺上線,通過對示範區監管數據中的風險性自動駕駛運作數據進行挖掘分析和場景還原,支撐自動駕駛企業開展自動駕駛演算法訓練和測試驗證。
降本增效
面向産業與社會轉型升級
“這些數據産品能在産業創新與政府管理多領域大顯身手。”該負責人介紹,北京車網打造的數據産品具體可應用於智慧城市和交通管理、輔助駕駛及自動駕駛、物流和出行平臺、地圖服務、保險金融、高校科研等領域,通過賦能智慧城市交通的精細化治理與自動駕駛技術和服務的迭代,綜合提升公眾出行體驗感和獲得感。
面向自動駕駛領域,這些數據産品就像車輛的“駕校題庫”。當前,自動駕駛行業面臨倣真數據和真實路況差距大、演算法泛化能力不足等問題,北京車網的數據集和場景庫等産品能提供海量真實數據,助力AI學習真實路況、讓車企降本增效。以示範區當前最大規模數據集預訓練數據集為例,它擁有車端、路側雙重視角,包含經過脫敏標注的超50萬幀圖片與超10萬條動態工況視頻。針對車輛目標識別,應用數據集裏幾萬幀特殊車輛等圖片訓練後,識別的準確率能從以往70%提升到90%以上。
對智慧交通來説,車路雲一體化數據産品能訓練“智慧管理大腦”,通過獲得每個交通參與者連續、高頻的行駛軌跡點,提升交通精細化水準。該負責人説:“當前,北京經開區也在利用車路雲一體化數據去賦能信控優化,最終實現綠波通行,有效緩解了區內的交通擁堵問題。隨着示範區向北京市更多區域拓展,車路雲一體化數據資源開發模式也能夠分享給更多區域,將‘亦莊經驗’因地制宜進行推廣。”
開放合作
招募數據生態夥伴
依託自動駕駛可信數據空間領先的技術保障與政策試驗環境以及示範區超7PB海量數據資源,北京車網廣發“英雄帖”,攜手生態夥伴共掘數據“金礦”。
“我們將面向相關政府管理部門、車企等數據需求方,數據標注企業、算力平臺等數據服務方,以及數據提供方開放合作。”該負責人表示。北京車網將為需求方和運營方,提供規範的車路雲網圖數據和更多的行業數據生態資源,為數據服務方帶來更多服務機會,為數據提供方提供合規、可信的數據供給渠道,實現多方共贏。
數據流通應用以安全可信為前提。近三年來,北京車網持續支撐示範區構建起“管理+技術”的雙重數據安全保障,讓數據資源在“上鎖”保障下“開放”。一方面,在示範區數據安全管理體系指導下,北京車網參與發佈了《車路雲一體化系統數據分類分級指南》團體標準,以及全國首個面向測試示範區的數據分類分級白皮書,為數據安全管理提供範本;另一方面,北京車網也自主研發了數據脫敏系統,開展數據加密傳輸與存儲,並依託數據流通監管沙盒合規機制保障,實現可信數據即取即用。
作為北京亦莊促進智慧網聯汽車高品質發展的重要領域之一,此次北京車網數據開放將加速“雙智融合”的落地。接下來,北京車網將與産業各方共建車路雲一體化數據要素生態圈,釋放數據開放合作的乘數效應,為數字經濟的發展貢獻“亦莊智慧”。