类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
147
-
浏览
6
-
获赞
333
热门推荐
-
中粮茶业拓展东南亚市场 普洱新品马来西亚首发
近日,中粮茶业云南公司举办的“中茶普洱 王者归来 茶美生活 情牵大马” 臻品蓝印大型主题发布品鉴会马来西亚站)在马来西亚首都吉隆坡举行。中粮茶业云南公司总经理邹广田表示,中粮茶R德波尔:德弗里的表现很稳定,邓弗里斯和弗林蓬不该同时在边路
6月23日讯 在欧洲杯第2轮小组赛,荷兰0-0平法国。荷兰名宿罗纳德-德波尔点评了一些球员的表现。罗纳德-德波尔首先表示:“德弗里可以得6.5分。他的失误很少,表现真的很稳定,而且总能赢得对抗。我认为波兰主帅:末战法国将被视为备战世预赛,莱万会继续留在国家队
6月22日讯欧洲杯小组赛D组第2轮,波兰1-3负于奥地利,遭遇两连败的同时,也成为本届赛季第一支被淘汰的球队。波兰主帅普罗比尔茨在比赛第二天出席新闻发布会,谈到了他的感受以及对莱万未来的看法。“从事体拉波尔特谈入选西班牙:曾给德尚发信息 但没回复
拉波尔特谈入选西班牙:曾给德尚发信息 但没回复_法国队www.ty42.com 日期:2021-06-28 10:31:00| 评论(已有287471条评论)Yeezy 篮球鞋双版本登陆,你准备好了么?
潮牌汇 / 潮流资讯 / Yeezy 篮球鞋双版本登陆,你准备好了么?2020年02月14日浏览:3921 此前,美乐淘潮牌汇便为大家带来了Yeezy 篮球鞋的相关发售再见曼联!红魔太子正式离队,4000万欧,拉爵不挽留,或加盟巴萨
在拉特克里夫获得曼联的运营权之后,今年的冬窗并没有进行过多的操作,只是将俱乐部的部分年轻球员租借到了其他的球队,这也是完全可以预期的,曼联失去了欧战的机会,他们在阵容上不需要那么多的球员,租借自然是最足协杯第四轮第4比赛日裁判安排:徐强强执法南京城市vs沧州雄狮
6月23日讯 足协杯官方公布了足协杯第四轮第4比赛日的裁判安排。6月23日19:30 南京城市vs沧州雄狮裁判员:徐强强第一助理:张美林第二助理:张超第四官员:孟祥昆裁判监督:胡剑虹取代索尼!曝iPhone 16将配备三星4800万主摄
快科技7月3日消息,据媒体报道,iPhone 16正在测试三星4800万传感器主摄。回顾以往机型,iPhone通常都是采用索尼公司的CIS,但去年开始,双方之间的合作出现了一些问题。报道称,由于索尼未优衣库 UT 全新 THE BRANDS MASTER PIECE 系列首波单品公布
潮牌汇 / 潮流资讯 / 优衣库 UT 全新 THE BRANDS MASTER PIECE 系列首波单品公布2020年02月20日浏览:3558 每一季 UNIQLO苹果推出iOS 18公测版 AI功能跳票9月才能用
iOS 18系统的最重要更新无疑就是苹果智能功能了,但在公测版系统中,苹果AI功能依然没有解锁,暂时无法正常使用,预计要等到9月份的正式版更新后,苹果AI功能才会开放。苹果今天公布了iOS 18公测版刚突破3万亿美元 顶级投资者:英伟达市值十年内可达50万亿
7月15日消息,在人工智能技术的推动下,NVIDIA股价今年已大幅飙升了162%,其市值已突破3万亿美元。著名投资人詹姆斯·安德森更是大胆预测,在未来十年内,NVIDIA市值有望达到惊人的50万亿美元电讯报:波切蒂诺可能面临压力,但若解雇他也找不到合适的
2月27日讯 在分析切尔西情况时,《每日电讯报》表示,波切蒂诺可能处于压力之下,但如果解雇他,切尔西也找不到合适的人选。无论任命时是否明确提及,波切蒂诺本赛季的最低目标就是率队拿到欧战资格,在联赛杯决maxmara六大经典款(maxmara六大经典款大衣介绍)
maxmara六大经典款(maxmara六大经典款大衣介绍)来源:时尚服装网阅读:6853maxmara是什么品牌?这款版型的大衣真绝了1、MaxMara是一个意大利品牌,始于1951年,创办人Ach同样坐上海磁浮线赶飞机,有人花40元有人花50元?
上海磁浮线从龙阳路到浦东国际机场的单程普通票价为50元,凭本人当日机票可享八折优惠,即40元。但这一优惠政策有些乘客并不知晓?近日,有网友称,这一优惠隐藏在《乘客须知》的条款中,字体太小;且《乘客须知中央气象台发布大雾黄色预警!河南南部局地有特强浓雾
中央气象台4月11日06时继续发布大雾黄色预警:预计,11日白天至夜间,山东半岛东部沿岸海域、黄海东北部海域、杭州湾附近海域、浙江北部沿岸海域将有能见度不足1公里的大雾。此外,11日早晨至上午,北京中