类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
7
-
浏览
5349
-
获赞
47698
热门推荐
-
UFC巨星谈C罗:史上最佳 激励了数以百万计的人
UFC巨星谈C罗:史上最佳 激励了数以百万计的人_哈比布www.ty42.com 日期:2021-10-06 09:01:00| 评论(已有305583条评论)迎重保,细维护,保安全——江苏空管分局气象台设备信息室完成换季维护工作
为了迎接即将到来的重大保障任务,确保设备和值班员工作均处于最佳状态,江苏空管分局气象台设备信息室组织全员开展了换季维护和换季学习工作。本次换季维护学习工作主要分为两个部分,第一部分为设备的换季维护工作水浒传中宋江为什么不和方腊联合攻打宋朝?
《水浒传》中宋江为什么不和方腊联合攻打宋朝?导读:事实上就当时的情况看来,宋江的军队最具有战斗力,这一点是无可厚非的,方腊就算是联合宋江,他在宋江的阵营中也是一个可有可无的战斗力量,但是,他确实是宋江广西空管分局气象台团支部组织青年做好执照考试备考工作
受疫情影响,中南地区多地空管分局站实行封闭运行管理,2022年下半年气象执照考试宣布延期举办。 针对该情况,广西空管分局气象台团支部认真组织部署封闭运行期间团员青年的执照考试复习工作,定时督数智赋能驱动融合创新,远光软件亮相2024电力数字化大会
11月6日至7日,2024电力数字化大会在北京举行。大会以“创新驱动、数智引领”为主题,聚焦数字技术在电力行业企业的融合创新应用。中国工程院院士、清华大学教授郑纬民等专家和电力九九重阳节 浓浓敬老情——东航山东保卫部(空保管理部)团总支开展重阳敬老主题活动
重阳节,农历九月初九,二九相重,称为“重九”,民间在该日有登高的风俗,所以重阳节又称“登高节”。10月份,空保管理部团总支开展“重阳敬厉兵秣马 严阵以待
通讯员:段宇飞)冬季影响呼伦贝尔机场的恶劣天气主要为降雪、积雪、低能见度及大风等天气现象,其中出现最为频繁的天气非降雪莫属。为提高冬季预报员遇降雪、低能见度等复杂天气下服务保障能力,确保复杂天气下气象刘彻究竟最喜欢谁?卫子夫陈阿娇还是李夫人
汉武帝刘彻究竟最喜欢哪个妃子?汉武帝当政54年,在此期间,他大规模扩大后宫人数。太初四年(前101年),明光宫建成之后,汉武帝立即选燕赵美女两千充后宫,所选的都是15—20岁的妙龄女子。不过,汉武帝后《战神》剧集找到新主创 《星际迷航:深空九号》编剧加盟
亚马逊Prime Video《战神》剧集,原编剧团队前脚刚走,新的剧集制作人已经找到了:《太空堡垒卡拉狄加》和《星际迷航:深空九号》编剧罗纳德·D·摩尔Ronald D. Moore)。据Deadli西安区域管制中心:平凡铸就不凡 行动诠释坚守
最近上映了一部根据真实事件改编的电影《平凡英雄》,我看完之后感慨万千!电影讲的是一个和田的七岁男孩,不小心被卷进拖拉机,胳膊断掉。和田的医生给出两种选择,要么直接截肢保命,要么续接断肢,但必须在担当清洁先锋,点滴做起提形象
为增强党员服务意识,东航山东分公司生产指挥中心第二党支部组织开展了“党员在行动”志愿服务活动。号召党员同志从点滴做起,从身边做起,率先垂范,切实起到先锋模范作用,引领支部各项工千年木乃伊头颅中残留取脑棒?竟因工作失误
科学家发现了2400多年前埃及木乃伊制作过程中遗忘在木乃伊体内的大脑移除工具,这项发现有助于科学家进一步理解神秘的木乃伊制作过程。网络配图他们发现一具2400年前的40岁女性木乃伊头颅上残留着一个9厘分析师:黄金中期上涨趋势已被破坏,需要时间重燃涨势
汇通财经APP讯——黄金今年表现出色,创下每盎司2790美元的历史新高,从2月份的低点上涨了40%以上,但一位分析师表示,中期上涨趋势已被破坏,宏观经济因素可能需要一段时间才能重新点燃黄金的涨势。OA为何明朝没有出岳飞?竟被人口30万的后金所灭
为何明朝没有出岳飞?竟被人口30万的后金所灭气数这玩意,说穿了,就是个使用年限,好比饼干,只能保质三天,你偏三年后吃,就只能拉肚子。又好比房子,只能住三十年,你偏要住四十年,就只能住危房,没准哪天上厕湖北空管分局蓝天鼎新航空服务有限公司召开内部控制体系建设工作会
通讯员:陈园园)10月21日,湖北空管分局蓝天鼎新航空服务有限公司组织召开内部控制体系建设工作会,公司领导及各部门负责人、内控领导小组、风险评估小组等相关人员参加会议。 会上,公司内控办