类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
18355
-
浏览
69163
-
获赞
7855
热门推荐
-
《adidas Archive》鞋款书籍即将上架,收录 357 鞋履
潮牌汇 / 潮流资讯 / 《adidas Archive》鞋款书籍即将上架,收录 357 鞋履2020年02月22日浏览:3560 近日,德国出版商 TASCHEN 推快递公司回收涿州泡水书制成信封:尽力为书商挽回损失
近日有网友发帖称,其收到一份快递后,发现快递的信封上印有“此文件封由涿州受灾图书回收再造”字样。消息发布后,引发了不少网友的热议,一名网友评论称,这种做法让那些遭遇泡水的图书得李煜被灭国是否活该 竟因一幅画杀掉忠心的名将
赵匡胤发动陈桥兵变建立宋朝后,厉兵秣马,开始了他统一中国的战争。在灭掉南汉后,宋太祖把进攻的目标转向南唐。南唐后主就是那个著名的李煜,这哥们填词作赋、谈情说爱是把好手,可要论到治国,他就是个废物。南唐西北空管局空管中心塔台管制室架起绿色通道,保障危重病人平稳着陆
2023年4月24日,凌晨00时49分,西北空管局空管中心塔台管制室接到进近通知,一架航班上有旅客突发心绞痛,需要紧急着陆,同时需要救护车和医生。接到消息后,塔台管制室立刻启动优先保障方案,通报现场协国家博物馆五一展览 收藏资讯
【中华收藏网讯】从4月29日开始,我们迎来了为期三天的“五一”小长假,既是和家人欢聚的时光,也是出游、学习充电的好机会。在文化底蕴深厚的北京,像故宫博物院、中国国家博物馆、中国美术馆、首都博物馆,都有贵州空管分局管制运行部“林丹旎劳模创新工作室”成员赴厦门空中交通管理站交流学习
为落实贵州空管分局2023年工作报告相关要求,分局管制运行部“林丹旎劳模创新工作室”成员赴厦门空中交通管理站以下简称厦门空管站)进行学习交流,旨在依托劳模创新工作室平台,秦始皇的墓为什么不能挖掘?里面还有哪些机关?
说秦始皇是千古一帝丝毫不夸张,作为统一六国的君王他有这个资格,并且作为第一个以皇帝自居的人所以历史称他为始皇,纵观秦始皇的一生个人认为他的前半生确实算得上是一个有理想有志气,有抱负的君王,但是他的后半关羽死后睁眼吓死曹操 死后吐了刘邦一脸血
在小说《三国演义》中,关羽被东吴偷袭擒获之后斩杀,后东吴为了转移刘备的仇恨而将关羽的首级送给曹操。曹操在打开装有关羽首级的盒子是说,云长公,别来无恙?这时,本来闭着眼的关羽突然睁开了眼,瞪着曹操,从此伊布放狂言:兹拉坦在米兰踢球 米兰就是意甲冠军
伊布放狂言:兹拉坦在米兰踢球 米兰就是意甲冠军_曼联www.ty42.com 日期:2021-10-06 09:01:00| 评论(已有305582条评论)(河北)维护女工权益 加强“四期”保护宣贯
通讯员 石磊 杨丽) 4月23日,河北空管分局技术保障部工会分会女工委员根据上级《关于转发〈人力资源社会保障部办公厅等6部门关于印发工作场所女职工特殊劳动保护制度参考文本)和消除工作场所性骚扰制度历史揭秘:狄仁杰死后武则天为何大哭不止?
武则天一手建立了他的武周天下,其中有多少心酸只有他自己知道。武周久视元年(700年)九月,内史狄仁杰病逝,终年71岁。女皇武则天闻讯,哭道:“朝堂空矣!”追赠文昌右相,谥号文惠,为之罢朝三日。武则天对日本战败后为什么天皇不剖腹自杀?天皇回答很无耻
对于一个国家而言,领导人是至关重要的,对于日本而言也不例外。战败的日本陷入一片混乱,而此时他们的领导人,裕仁天皇陛下,气定神闲地念着《终战诏书》,顺便煽动属下的情绪,让他们尽快为小日本“献身”。裕仁天市场监管总局启动第十届“电梯安全宣传周”活动
中国消费者报讯根据2021年全国“质量月”活动安排,按照“安心乘梯守护行动”工作要求,9月13日至19日,市场监管总局启动第十届“电梯安全宣“新航季 皖美飞”龙江航空参加合肥新桥机场换季推介活动
4月22日,龙江航空受邀参加“新航季、皖美飞”合肥新桥机场十周年2023夏航季航班航线暨航旅产品推介活动。活动在包河区志愿服务广场举办,通过“航空+旅游&rd死的最搞笑的君主 竟因大便时用力过猛而死
众所周知,君主是死亡率最高的职业,而很多君主死的方式很奇葩。可是咱们中国的皇帝死的方式再奇葩也没有这个外国的国王死的奇葩,他竟然是因为大便时用力过猛而死。 这个国王就是英国的国王乔治二世。网络配图乔治