类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
2892
-
浏览
7354
-
获赞
4
热门推荐
-
BEAMS x Columbia 联名 90s 军事风系列公布,6 种款式
潮牌汇 / 潮流资讯 / BEAMS x Columbia 联名 90s 军事风系列公布,6 种款式2020年02月26日浏览:3094 此前携手始祖鸟等多品牌进行合作借力民俗文化舞台 展现农行品牌形象
海云庵糖球会作为青岛市区规模和影响力最大的文化活动,以其悠久的历史和浓厚的民俗韵味深受广大市民的关注。青岛农行在“春天行动”活动中巧借糖球会这一有利时机,近日组织开展了农行金融湖北:曝光8起“铁拳”行动典型案例
中国消费者报报道张永康记者吴采平)今年以来,湖北省各级市场监管部门扎实推进2022民生领域案件查办“铁拳”行动,严厉打击食品安全违法违规、加油机计量作弊、侵权假冒、“神医”“神药”等虚假违法广告、售卖广西南宁加强网络经营行为监管
中国消费者报南宁讯何正君记者顾艳伟)8月15日,记者从广西南宁市市场监管局了解到,自今年8月起,市场监管部门利用近3个月时间,在全市范围内开展“网剑2022—反欺诈 稳消费 打侵权 促发展”专项行动,锐步 Question Mid 乔治城配色“Georgetown”鞋款抢先预览
潮牌汇 / 潮流资讯 / 锐步 Question Mid 乔治城配色“Georgetown”鞋款抢先预览2020年02月23日浏览:2714 既红蓝鸳鸯及燕麦配色之后,福建漳州开展食品抽检合格备份样品捐赠活动
中国消费者报福州讯记者张文章)8月11日,福建省漳州市市场监管局到漳州市福利院开展食品抽检合格备份样品捐赠活动,这批赠品均已购买了食品安全责任保险。活动期间,举办了捐赠仪式、并组织参观福利院、看望福利热血江湖sf,现在有好玩一点的热血江湖SF没有? 不要变态,想回味10几年前的感觉。
热血江湖sf目录热血江湖sf现在有好玩一点的热血江湖SF没有? 不要变态,想回味10几年前的感觉。求推荐一个热血江湖SF耐玩的普通玩家也可以生存的 辛苦不要紧有路走就行人多一点的请问有什么好的热血江湖传亚马逊将成微软云服务客户 交易金额超10亿美元
据最新曝光的内部文件和知情人士透露,微软正在准备与亚马逊达成云服务合作协议,交易金额超过10亿美元。据悉,亚马逊将成为微软Microsoft 365云服务的客户。这家零售巨头已承诺在未来五年内支付超过美潮 Carhartt WIP 2020 春夏系列 Lookbook 赏析
潮牌汇 / 潮流资讯 / 美潮 Carhartt WIP 2020 春夏系列 Lookbook 赏析2020年02月18日浏览:3286 部分单品已经上架发售后,式工装福建厦门夜间突击检查网红餐饮店 立案4起
中国消费者报福州讯林伟 吴静婍 记者张文章)深夜食堂能否放心吃?福建省厦门市思明区市场监管局对网红餐饮店聚集的明发商业广场开展为期一个月的夜间错峰监管。截至8月11日,已对存在后厨卫生脏乱差、海鲜池内热血江湖sf,现在有好玩一点的热血江湖SF没有? 不要变态,想回味10几年前的感觉。
热血江湖sf目录热血江湖sf现在有好玩一点的热血江湖SF没有? 不要变态,想回味10几年前的感觉。求推荐一个热血江湖SF耐玩的普通玩家也可以生存的 辛苦不要紧有路走就行人多一点的请问有什么好的热血江湖湖北:曝光8起“铁拳”行动典型案例
中国消费者报报道张永康记者吴采平)今年以来,湖北省各级市场监管部门扎实推进2022民生领域案件查办“铁拳”行动,严厉打击食品安全违法违规、加油机计量作弊、侵权假冒、“神医”“神药”等虚假违法广告、售卖Reebok eightone 支线系列释出,与 Kohei Okita 联合打造
潮牌汇 / 潮流资讯 / Reebok eightone 支线系列释出,与 Kohei Okita 联合打造2020年02月18日浏览:5364 经过曝光预热后,Ree索尼申请“自动游戏”功能专利:让AI代跑图或练级
虽然让游戏自动玩的想法听起来很蠢,但这一功能已悄然在许多PC和手机游戏中出现。自动游戏的想法主要盛行于大型MMORPG游戏中,即使你暂时离开,游戏也会自动执行某些重复性任务。这一功能在主机游戏中尚未成樱桃西红柿丰收可采摘 一茬果品果农能赚10万
樱桃西红柿种植大户邀请市民尝鲜室外还是寒气逼人,大棚内已是春意盎然,挂在枝头红的、粉的、绿的樱桃西红柿,已经等不及了,带来早春的一片果香,平度明村镇的1.2万亩樱桃西红柿迎来丰收季。昨天,明村镇首届樱