激活“沉睡”数据 建设算力集群 北京国企为人工智能产业添动能

日期:2024-04-07 08:27    来源:北京日报

分享:
字号:        

  近日,在“发展新质生产力,扎实推进国企高质量发展”主题采访时了解到,北京国企正在发挥各自优势,加速布局数据和算力赛道,为壮大人工智能产业增添动能。

  人工智能时代,数据是新型生产要素。作为北京打造全球数字经济标杆城市的重要平台,北京金控集团旗下北京国际大数据交易所全力搭建基础设施,加速汇聚“沉睡”于各处的数据资源,使之变成数据产品流通起来。

  作为新生事物,交易所成立刚满3年,数据交易的市场生态在加速形成。以数据要素供给为例,交易所已联合大型头部机构和企业推进建设多元化社会数据专区,涵盖交通、气象、能源、金融、文化、通信、工业、科学、自动驾驶、算力交易、人工智能等多个领域。

  作为新质生产力的代表,人工智能近年来异常火热。发展人工智能,高质量的数据是核心要素之一。以人工智能大模型训练数据为例,过去通过互联网收集的免费数据已不能满足训练需要。而与此同时,过去发展中形成的大量数据仍分散在各个单位或市场主体内部,导致中文语料库“激活”的比例很低。

  数据交易所通过建立一整套完善的交易服务体系,帮助市场需求对接,将原始数据“挖掘”成为数据产品,释放数据资产的价值。北京国际大数据交易所负责人表示,作为数据流通交易的枢纽,交易所扮演的角色就如同数据的“中央厨房”。

  目前,交易所正在持续推动建设更大规模的大模型训练语料库,推动非公开数据集和算力进场交易,为北京AI原生产业发展提供支撑保障。

  就在近期,交易所刚刚发布北京100个人工智能大模型高质量训练数据集。数据集首次汇聚来自中国科学院大气物理所、北京科学技术研究院、中国知网等36家单位提供的非公开数据集,涉及20多个应用场景。

  算力也是支撑人工智能发展的重要基础设施。北京中发展智源人工智能科技发展有限公司董事长周瑞介绍,2023年,中关村发展集团在门头沟投资建设100P(1P约等于每秒1000万亿次计算速度)国产自主可控的算力,这大体相当于5万台家用电脑的计算水平。

  伴随着人工智能“百模大战”而起,这一前瞻布局如今正撬动着更多社会资源向京西聚集。一个多月前,在第二届北京人工智能产业创新发展大会上,北京首个自主创新人工智能算力集群宣告落地于此,未来将汇聚千P级算力,为企业提供触手可及、普惠高效的算力服务和模型调用支持。周瑞表示,2024年底,更大规模的算力集群将建成投用。(孙杰)

您访问的链接即将离开“首都之窗”门户网站 是否继续?

已归档