类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
76
-
浏览
988
-
获赞
7575
热门推荐
-
007 x 阿迪达斯联乘鞋款上脚图首次曝光,邦德同款!
潮牌汇 / 潮流资讯 / 007 x 阿迪达斯联乘鞋款上脚图首次曝光,邦德同款! 2020年02月22日浏览:3390 近日,Adidas与 007 联乘Ultra B世界七大火焰龙卷风,5次就发生在美国(破坏力超强)
龙卷风大家应该都知道是什么了,但是你见过火焰龙卷风吗?火焰龙卷风故名思议就是由火而形成的一种龙卷风,是一种非常罕见的自然现象。那么火焰龙卷风是如何形成的呢?出现过的案例有哪些呢?今天就和大家来一起盘点(河北)加强有效沟通 共保跑道安全
通讯员 周嘉楠)为进一步做好石家庄正定机场的防跑道侵入工作,4月21日,石家庄机场、河北空管分局与三大驻场航司联合召开了跑道安全工作沟通会,重点对防跑道侵入工作及信息通报要求开展研讨交流。 在会阿克苏机场开展航站楼应急处置演练
中国民用航空网通讯员魏世清 崔强讯:为切实加强消防安全工作,提高全员消防安全素质和自救能力,及时排除消防安全隐患。4月21日,阿克苏机场组织开展航站楼应急处置演练。 本次演练模拟为航站楼茶餐新百伦 x Aimé Leon Dore 全新联名 827 鞋款释出
潮牌汇 / 潮流资讯 / 新百伦 x Aimé Leon Dore 全新联名 827 鞋款释出2020年02月27日浏览:2925 不久前,纽约街牌Aimé Leon雍正皇帝难得的兄弟情谊 一次赏银23万两!
雍正元年,刚刚坐上皇位的胤禛加封爱弟允祥为王,一次赏赐白银23万两。允祥不敢接受如此之多的赏银,因为当年胤禛受封时得到的就是这么多,细心的允祥不敢跟皇兄当年拿一样多,只接受了13万两。雍正还要赏赐允祥新疆机场(集团)运管委空管中心配合天翼科创自动转报系统升级服务
通讯员:王序 王晓沛 蒲梦华) 为进一步加强新疆机场集团自动转报安全管理,近日,集团运管委空管中心与天翼科创有限公司工作人员积极配合,深入开展了自动转报升级改造,有序完成了安全专线布设、升级软件更新与王莽在篡位后为何让一个卖饼的人做大将军?
王莽是一个什么样的人,两千多年来大部分国人对他的评价是一个伪君子、阴谋家、奸臣。是非功过,难以一概而论。但是可以肯定的是,他绝对是一个智慧超群的人,不然,也不可能篡得了皇位。但是令人惊讶的是,登上帝位恩捷股份(002812)固态电解质技术交流会:已建成硫化锂百吨级中试产线
11月14日,恩捷股份002812)线上召开固态电解质技术交流会。会议上,恩捷股份就固态研发进展、技术优势、专利布局等进行了分享和交流。恩捷股份提到,公司2021年开始布局硫化物电解质材料领域,成立控雍正皇帝难得的兄弟情谊 一次赏银23万两!
雍正元年,刚刚坐上皇位的胤禛加封爱弟允祥为王,一次赏赐白银23万两。允祥不敢接受如此之多的赏银,因为当年胤禛受封时得到的就是这么多,细心的允祥不敢跟皇兄当年拿一样多,只接受了13万两。雍正还要赏赐允祥盘点大明王朝最让人难忘又有趣的事情
1,写完《牡丹亭》后的汤显祖成为万千少女的爱慕对象,有一位貌美无双的女子,立誓非汤显祖不嫁,汤显祖说自己太老不合适,女子不信。一次汤显祖在西湖边请客吃饭,女子激动得赶紧去围观了一下,结果看见汤显祖原来明朝一座神奇建筑,几百年间怪事不断,连科学都无法解释
导读:武当山,位于湖北省西北部,被誉为“道教圣地”,据传是真武大帝得道成仙之处,共有十大洞天,三十六洞天,七十二福地。明成祖朱棣继位后,命隆平侯张信、驸马督尉沐昕、礼部尚书金纯等人,率领20多万军民及李铁:尊重和重视每一个对手 长期封闭对球员非常残酷
李铁:尊重和重视每一个对手 长期封闭对球员非常残酷_比赛www.ty42.com 日期:2021-10-06 23:31:00| 评论(已有305679条评论)世界三大未解之谜之一,死伤两万多人,至今无人能解
人类的漫长的历史演化中,留下无数奇迹,也留下无数谜团。今天要讲的这个谜团,是世界三大自然灾难之谜之一。除此,这个谜团是发生在古代的中国,那就是王恭厂大爆炸。中国的王恭厂大爆炸,与印度“死丘”事件、俄罗趣谈野史:谁是慈禧太后一生中最敬畏的男人?
咸丰二年的选秀咸丰帝被后人诟称为无远见、无胆识、无才能、无作为的“四无”皇帝,面对国库空虚、军伍废弛、吏治腐败、天灾不断、百姓起义此起彼伏、西方列强虎视眈眈的烂摊子,他一筹莫展,干脆沉迷声色,纵欲自戕