6月6日,2025北京智源大會在京啟幕。伴隨着多項全球前沿的人工智慧成果發佈,包括圖靈獎獲得者、明星AI企業創始人在內的數百位全球青年科學家、人工智慧頂尖學者和産業專家齊聚北京,在這場科技盛會中共同繪製人工智慧産業未來“導航圖”。
AI“破壁”加速進入物理世界
當一個咖啡杯放在桌子的邊緣,人和AI會各自作何反應?不少AI大模型看到的可能是“白色的咖啡杯在桌上,上面有一些文字”。而更具時空預測能力的人類則會基於現實資訊進行預判——“咖啡杯在桌子的邊緣,很危險”,並知道需要從外向內的方向拿取杯子來避免它掉落。
“人工智慧正在加速從數字世界走向物理世界,這是對大模型技術發展趨勢的判斷,也是‘悟界’系列大模型推出的底層原因。”智源研究院院長王仲遠説,AI從數字世界跨向物理世界時必須突破兩者之間的隔閡,其中最重要的隔閡和邊界就是對空間和時間的感知。而此次智源發佈的原生多模態世界模型Emu3,就具備這種在物理世界中理解和推理的能力。
據悉,目前全球眾多人工智慧機構都在積極探索原生多模態技術。什麼叫“原生”?人類與現實世界的互動,通常需要涉及語言、視覺和音頻等被業界稱為“多模態”的資訊。王仲遠説,過去的多模態大模型往往是先學習“語言”再訓練其處理圖像、聲音等其他模態資訊的能力,而在接觸其他模態資訊的過程中,原本已達到“博士”水準的模型能力可能會降至“大學”甚至“高中”水準。
相比之下,“原生”多模態模型則是在模型訓練初始階段,就將文字、圖像、聲音,乃至腦信號等各種模態數據都納入其中進行訓練,能讓模型像人一樣更“融會貫通”地理解世界。
除了原生多模態世界模型Emu3,此次智源研究院發佈的“悟界”系列大模型成果,還包括腦科學多模態通用基礎模型見微Brainμ、跨本體具身大小腦協作框架RoboOS 2.0與具身大腦RoboBrain 2.0以及全原子微觀生命模型OpenComplex2。
從微觀生命體到具身智慧體,“悟界”系列大模型試圖揭示生命機理本質規律,構建人工智慧與物理世界交互基座。王仲遠透露,以Brainμ為例,在與腦機介面企業強腦科技的合作中,Brainμ實現了首次在攜帶型消費級腦電系統上重建感覺信號,智源正與北京生命科學研究所、清華大學、北京大學、復旦大學等機構合作,探索Brainμ在科學、工業等領域的應用。
北京AI核心企業數超2400家
除了大模型“大腦”,作為連接人工智慧與現實世界的重要載體,具身智慧機器人也成為AI行業的關注熱點。
時而單腿側踢、時而雙臂交替出拳,宇樹G1機器人在舞臺上表演起敏捷帥氣的格鬥“組合拳”;“我中午又熱又餓,給我搞點吃的”,聽到顧客的指令後,銀河通用的具身大模型機器人Galbot在琳瑯滿目的零食貨架前為顧客推薦了酸奶和果凍,並有條不紊地拿取送到人手中;曾在全球首個人形機器人半程馬拉松中奪得冠軍的天工2.0也不閒着,在現場為大家準備起了茶點……6月6日,在2025北京智源大會的舞臺上,近兩年科技圈的“頂流”人形機器人組團上臺亮絕活,贏得滿堂觀眾喝彩。
這些明星機器人,有不少都是來自北京的企業或機構。以Galbot為例,它的同伴目前已經在北京的7處無人藥店上崗。銀河通用創始人兼CTO王鶴透露,2025年將在北京、上海、深圳開100家這樣的無人藥店。“相信以後在超市裏處理訂單、在車廠裏配料,人形機器人都能當家做主。”王鶴説。
“在人工智慧領域,北京始終走在創新的最前沿,努力在人工智慧發展進程中尋找新的歷史坐標。”市科委、中關村管委會相關負責人介紹,近年來,北京堅持主流路線與顛覆性路線並重,持續支援人工智慧技術創新,並堅持大模型垂直開發與推廣並重,積極推動人工智慧應用創新。
據悉,2024年北京人工智慧的核心企業數突破2400家,核心産業規模近3500億元,均佔全國一半。
尖峰對話共議人機共生
在展示成果的同時,這場國際性的AI交流盛會還吸引眾多頂尖學者、産業專家圍繞多模態、深度推理、下一代AI路徑、Agent智慧體、具身智慧、AI産業、AI安全等話題展開前瞻對話。
圖靈獎得主約書亞·本吉奧提醒,當前AI在規劃、推理等領域進步飛速,部分前沿模型已顯現自我保護、欺騙性對齊、篡改系統等類生物主體行為,若形成“智慧+自主目標+行動能力”組合將引發失控風險,甚至可能威脅人類生存。
“要在AGI(通用人工智慧)可能於5年內達到人類水準的緊迫時間窗口內,通過技術創新與全球協作築牢安全防線。”本吉奧呼籲,應推動全球協同治理,建立國際監管框架與技術驗證機制,遏制各國因競爭導致的安全標準缺位,避免將AGI設計為人類競爭者。
AI時代,人類如何與AI新夥伴們共生?另一位圖靈獎得主理查德·薩頓提出,要以去中心化合作替代中心化控制,通過信任、協調和市場機制引導AI與人類共生,避免因恐懼催生的限制措施。他認為,這一路徑將實現AI與人類社會的互利共贏。(孫奇茹)