NVIDIA在AI世界模型上加倍
喜欢指数的未来?加入我们的Xpotential社区,通过Xpotential University的课程进行未来的证明,阅读有关指数技术和趋势,连接,观看Keynote或浏览我的博客。
NVIDIA是数万亿美元的人工智能(AI)Chip Beymoth,宣布它正在进入“世界模型” - AI模型,这些模型从人类自然发展的世界心理模型中汲取灵感。
在拉斯维加斯的CES 2025上,该公司宣布,它使公开提供一个世界模型的家庭,可以预测和生成“物理学意识”的视频,这是一笔巨大的交易,尤其是当您考虑到更多的公司在模拟中开发新产品的事实,例如,在模拟中开发了新产品,甚至创建了大型的世界大型数字双胞胎,例如为整个地球建模。Nvidia称这个家庭宇宙世界基金会模型或简称Cosmos WFM。
这些模型可用于特定应用程序,可从NVIDIA的API和NGC目录,GitHub和AI Dev平台拥抱面。
该公司在博客文章中写道:“ NVIDIA将提供基于物理的模拟和合成数据生成的第一波Cosmos WFM。”“研究人员和开发人员,无论其公司规模如何,都可以根据NVIDIA允许的开放式模型许可自由使用Cosmos模型,从而允许商业使用。”
Cosmos WFM家族中有许多模型,分为三类:用于低延迟和实时应用的Nano,“高性能基线”模型的超级型号,以及超级质量和忠诚度输出的Ultra。
该模型的规模从40亿到140亿个参数不等,其中Nano是最小和最大的参数。参数大致对应于模型解决问题的技能,并且参数更多的模型通常比具有更少参数的模型表现更好。
作为Cosmos WFM的一部分,NVIDIA还发布了一种“ UP Sampling模型”,这是一种优化用于增强现实的视频解码器,以及确保负责任使用的护栏模型,以及用于为自动驾驶汽车开发的传感器数据(例如生成传感器数据)的微调模型。NVIDIA在AI中说,这些以及其他Cosmos WFM模型以及从2000万小时的实际人类互动,环境,工业,机器人和驱动数据进行了对9,000万亿个代币进行了培训,在AI中,“代币”代表了原始数据的位,这是视频较大的原始数据。
NVIDIA不会透露此培训数据的来源,但是至少一份报告和诉讼 - 声称该公司未经许可接受了受版权保护的YouTube视频培训。
NVIDIA发言人表示,宇宙发言人“并非旨在复制或侵犯任何受保护的作品”。
发言人说:“宇宙就像人们学习一样学习。”“为了帮助宇宙学习,我们从各种公共和私人来源收集了数据,并有信心我们对数据的使用与法律的字母和精神一致。关于世界的运作方式 - 这是宇宙模型所学的事实 - 不是可版权保护或受任何个人作者或公司的控制。”
版权专家说,抛开像宇宙这样的模型并不能像人们学习的那样真正学习的事实,例如Nvidia's,从公平使用法律学说中获得支持的主张可能无法接受司法审查。这些公司是否占上风将在很大程度上取决于法院如何决定公平使用,这允许使用受版权保护的作品来制作新事物,只要变革性,适用于AI培训。
NVIDIA声称,给定文本或视频帧的Cosmos WFM模型可以生成“可控,高质量”的合成数据,以引导对机器人,无人驾驶汽车等的模型培训。
Nvidia在新闻稿中写道:“ NVIDIA COSMOS的开放式模型套件意味着开发人员可以使用数据集自定义WFM,例如自动驾驶汽车旅行的视频或机器人录制仓库。”
“ Cosmos WFM是用于物理或体现的AI研究和开发的专门建造的,可以从文本,图像和视频等输入组合以及机器人传感器或运动数据中生成基于物理的视频。”
NVIDIA表示,包括Waabi,Wayve,Foretellix和Uber在内的公司已经致力于为各种用例驾驶Cosmos WFM,从视频搜索和策划到为自动驾驶汽车构建AI模型。
Uber首席执行官Dara Khosrowshahi在一份声明中说:“生成的人工智能将为流动性的未来提供动力,需要丰富的数据和非常有力的计算。”“通过与NVIDIA合作,我们有信心我们可以帮助为该行业的安全和可扩展的自动驾驶解决方案增强时间表。”
要注意的是,NVIDIA的世界模型并不是最严格的意义上的“开源”。要遵守一个广泛接受的开源AI定义,AI模型必须提供有关其设计的足够信息,以便一个人可以基本上重新创建它,并披露有关其培训数据的任何相关细节,包括出处以及如何获得或许可数据。
NVIDIA尚未发布Cosmos WFM培训数据详细信息,也没有提供从头开始重新创建模型所需的所有工具。这可能就是为什么科技巨头将模型称为“开放”而不是开源的原因。
NVIDIA首席执行官詹森·黄(Jensen Huang)在周一的新闻发布会上说:“我们真的希望[宇宙]为机器人技术和工业人工智能世界做些什么……为企业所做的。”