类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
-
文章
88
-
浏览
647
-
获赞
1
热门推荐
-
atmos x 阿迪达斯 ZX 8000 联名鞋款曝光,异国情调凸显
潮牌汇 / 潮流资讯 / atmos x 阿迪达斯 ZX 8000 联名鞋款曝光,异国情调凸显2020年02月26日浏览:2782 既蛇纹及黄蓝配色之后,近期 Adid汕头空管站通信枢纽室有序开展甚高频电台年度维护工作
2022年8月29至9月6号,汕头空管站通信枢纽室有序开展甚高频无线电台自主性维护工作,顺利完成了2个台站共计105部甚高频电台和15根收发天线的年度维护工作,为甚高频设备的稳定运行打下了坚实基历史上对付贪官最狠的皇帝 在位杀贪官无数!
贪官自古以来都是存在的,他们利用职务上的便利,侵吞、窃取、骗取或者以其他手段非法占有群众或公共财物。人们非常的痛恨贪官,当然每个王朝都在整治贪官污吏,但是都是治标不治本,但是有这么一个朝代的皇帝,在他华北空管局通信网络中心与华为公司开展业务交流
本网讯通讯员 郑利彬 王雪松)9月9日,华北空管局通信网络中心与华为公司北京办事处开展业务交流,相关负责人及民航通信网小组成员参加交流会。 交流会上,通信网络中心首先介绍了华为公司的服务器、路由器、阿迪达斯 Ultra Boost 全新升级版释出,更轻更凉爽
潮牌汇 / 潮流资讯 / 阿迪达斯 Ultra Boost 全新升级版释出,更轻更凉爽2020年02月21日浏览:3323 阿迪达斯旗下不断进化的 Ultra Boos海航航空旗下乌鲁木齐航空深入开展师徒“传帮带”,稳步推进人员素质能力提升
通讯员 裴尊伟)“流逝的时间从不停歇,转眼一年已过去三分之二,疫情肆虐,我们大家始终要毫不松懈地坚守在工作岗位上,有什么困难、有什么问题都不要怕,我们一起解决。”刘盼刚说完后结倾囊相授车辆维修经验!美兰机场汽车服务部江耀春师徒的故事
在海口美兰国际机场以下简称“美兰机场”),有一个技术达人,同事们都会尊称他一声“江师傅”。他就是来自美兰机场汽车服务部车辆维修中心的教员江耀春。他入职已克拉玛依机场召开专题会全力备战“二十大”
通讯员:袁洁)9月13日,克拉玛依机场召开“二十大”保障工作临战阶段动员部署会议。克拉玛依机场总经理在会上强调,要以本次临战阶段动员部署会议为契机,进一步加强机场安全保障工作的辽宁:省市区12315部门三级联动 优化市场服务环境
中国消费者报沈阳讯(记者王文郁)9月9日,《中国消费者报》记者从辽宁省市场监管局了解到,辽宁省市场监管事务服务中心投诉举报中心近日会同沈阳市市场监管投诉举报中心、浑南区市场监管局召开专题座谈会议,就O为什么黄袍加身的陈桥兵变是史上最成功的兵变
“陈桥兵变黄袍加身”这个脍炙人口的历史故事说的是赵匡胤通过兵变夺取了后周的政权,建立了宋朝的故事。那么陈桥兵变是怎么回事呢?为什么说陈桥兵变是历史上最成功的一次兵变?陈桥兵变的时间陈桥兵变发生在后周。揭秘:寡妇夏姬竟是如何迷惑三国君王的?
夏姬,春秋时郑穆公之女。初嫁子蛮。子蛮早死,继为陈国大夫夏御叔之妻,生子徵舒。御叔死,她与陈灵公、大夫孔宁、仪行父私通。徵舒射杀灵公,孔宁等奔楚,请楚师伐陈。她被楚庄王所俘,送给连尹襄老为妻。襄老战死阿克苏机场与华夏航空召开“干支通、支支通、全网联”中转业务提升会
中国民用航空网通讯员俞倩讯:以推广“平安行”中转服务为重要抓手,为达到国内通程航班和机场集团“快线+环线+机坪中转+隔离区签转”试点单位的双重要求,9月王霜英超首秀,可以载入记录的27分钟
转播平台近40万的球迷关注着这一场比赛、当她登场时满屏弹幕都是“她来了”。这是今年1月1日正式加盟热刺后,王霜在正式比赛中的首秀。此前她因伤病影响仅参加过1月8日热刺与查尔顿竞技的友谊赛。 27分钟建文帝儿子被朱棣圈禁50年 竟连牛马都不认识
建文帝就是明朝的第二个皇帝朱允炆,他是明太祖朱元璋的孙子,也是早逝的太子朱标次子。一三九二年太子朱标病逝,朱允炆就被朱元璋立为皇长孙,朱元璋死后,他就顺理成章的成为了皇帝,史称建文帝。网络配图这位皇帝海航航空旗下乌鲁木齐航空复航乌鲁木齐=和田航线,推动疆内航线干支联动!
通讯员 谢承宗)为不断优化疆内网络布局,加强干支联动,海航航空旗下乌鲁木齐航空有序开展航线恢复工作,为广大旅客朋友提供更加灵活的出行选择,2022年9月11日乌鲁木齐航空正式复航乌鲁木齐=和田航线。据