近日,京西智谷“潭柘智空”文生视频大模型正式发布阶段性成果,作为北京市发展和改革委员会批复的AI+广电重点示范标杆场景项目和门头沟区重点打造的超高清计算视听应用平台,“潭柘智空”发挥AI产业集群优势,依托京西智谷600P国产算力底座和央视网高质量数据集,以“千亿参数+时代语料”双轮驱动,搭建了覆盖产业链、内容链、技术链与安全链的综合生态,实现“所想即所得”的AIGC视听新体验。在技术层面,平台融合智谱清言的AI生图、多语言翻译、民族语言模型以及国研能汇的智能剪辑与风格化处理能力,打通从创意生成到成片输出的全链路闭环。同时,海天瑞声数字人平台以分钟级克隆、多语言支持与全方位安全管控,进一步增强平台在政务、传媒等场景的交互能力。
核心生成能力 引领超高清 AIGC 视觉体验。“潭柘智空”的核心突破在于其强大的文生视频能力。目前,模型已能够根据文本描述,直接生成连续15秒、4K/60帧的超高清视频,并支持“无限续写”以延展内容。无论是自然风光还是科幻场景,皆可高度还原文本创意,实现“所想即所得”的创作愿景,为内容产业提供了强大的生产力工具。
全链路创作支持,从灵感到成片的一站式解决方案。模型构建了覆盖“创意生成-内容制作-智能交互”的全链条能力。AI生图模块具备高语义对齐能力,可快速生成多种画幅、风格的高清图片,精准满足初期创意可视化需求。智能剪辑与风格化平台可自动识别视频内容,完成智能切片、打标与剪辑,并提供国风、卡通等多元风格化处理,大幅降低专业视频制作门槛。AI数字人平台支持通过少量真人资料快速克隆数字分身,结合大模型知识库,轻松实现视频播报、直播互动等应用,让交互更具情感与效率。
深度文化理解与跨语言传播,彰显技术包容性与国际视野。民族语言模型标杆,平台内置独家汉藏大模型,实现精准的双语对话与实时翻译,深度理解民族文化,填补了藏语智能处理的空白。多语言平台高效协同,支持全球100多种语言的毫秒级翻译与交互,为内容的国际传播与跨文化合作提供了坚实的技术桥梁。
智慧媒资与安全审核,构建安全高效的内容生态。平台汇聚央视网高质量视听数据资源,其智慧媒资系统可实现内容的快速检索与精准定位。同时,依托央视网深厚的审核经验,内置智能审核系统能有效识别并拦截多种违规不良信息,确保内容生产的安全与质量,构建健康可靠的内容生态。
标杆案例落地,技术赋能人文与影视创新。首个标杆案例《山河家书》系列短片展示了模型在历史影像复原方面的能力,生动再现英雄事迹,实现了爱国教育的“可视传承”。同时,京西智谷已与金鸡奖导演达成合作,将利用“潭柘智空”大模型为影视剧生成大量特效镜头,探索国产大模型在影视工业化中的应用,有效降本增效。
“潭柘智空”大模型的成功发布,是京西智谷贯彻落实“人工智能+”行动、发展新质生产力的关键里程碑,标志着京西智谷正式开启了以智能算力驱动视听产业变革的新篇章。展望未来,京西智谷将以此为全新起点,充分发挥“潭柘智空”大模型的技术溢出效应与品牌引领作用,持续扩大其在影视制作、数字文旅等领域的示范应用。通过加速引育上下游企业、推动XR沉浸式实验室等平台实体化运营,积极构建集技术研发、场景创新、产业集聚于一体的计算视听产业生态高地。以“京西智谷”范式,推动“北京大视听”品牌建设,为首都数字经济高质量发展再添新的增长极。