类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
78937
-
浏览
638
-
获赞
8
热门推荐
-
马连奴箱包属于哪个品牌(马连奴的包是真皮吗)
马连奴箱包属于哪个品牌(马连奴的包是真皮吗)来源:时尚服装网阅读:1551马连奴.奥兰迪这个牌子的皮包怎么样?中档价位。马连奴奥兰迪主张演绎快时尚,其品牌皮包价位在200元至1500元不等,致力于将国李自成死亡之迷:其实并没出家 是发生了意外!
明朝末年,在朝廷残酷的压迫下,百姓苦不堪言,全国各地都爆发了农民起义,其中力量最大的一支是李自成领导的,虽然最后他领导的起义失败了,但是在当时的影响却十分深远,甚是可以说是改变了历史的走向。随着起义军新疆南方航空公司加密乌鲁木齐=克拉玛依定期航班
10月25日起,中国南方航空公司加密乌鲁木齐机场往返克拉玛依的航班,由换季前每天执飞一班增加到了两班,为旅客出行提供了更多选择。 新增航班依旧采用B737-800机型,航班号CSN6683/4。航中国航油五台山供应站机坪现场考核评比加油标兵
为全面贯彻党中央、国务院对安全生产工作的重要指示批示精神,扎实落实民航局、集团公司各项要求部署,进一步巩固机坪安全专项整顿成果,日前,中国航油五台山供应站开展飞机加油员现场考核评比标兵活动,加油员每月耐克 Blazer Low 北卡蓝配色“UNC Blue”鞋款抢先预览
潮牌汇 / 潮流资讯 / 耐克 Blazer Low 北卡蓝配色“UNC Blue”鞋款抢先预览2020年02月15日浏览:3160 在看过了“Dorothy Gate认真对待颠簸,让旅客平安舒适回家
通讯员 高丽玮)进入秋冬季以来,空中颠簸,导致飞机改变高度,机上人员受伤的情况时常发生,它已经成为影响航空安全的重要隐患之一。空中颠簸的产生,主要是由于大气中存在乱流。这些不稳定气流的范围有大有小,方中国航油山西分公司开展地震应急救援桌面演练
“各单位请注意,各单位请注意,XX市城区发生6.0级地震,我公司有强烈震感,现启动《山西分公司自然灾害专项应急预案》I级响应,请按照预案做好人员疏散工作,收到请回复。”随着总指秦国第一名将为什么不是白起王翦而是司马错?
揭秘秦国第一名将为什么不是白起王翦而是司马错?蜀地要成为秦国统一天下的后勤基地,政治安定、经济繁荣是头等大事。从公元前三一六年开始,秦国的蜀守张若就在主持这项工作,前后长达四十年。四川土地肥沃,人口较被阿扎尔踢的球童:当时我以为是马塔干的,他们告诉我是阿扎尔
2月1日讯 近日切尔西功勋阿扎尔与当年被他踢的球童查理-摩根重聚,两人畅谈往事。查理-摩根说:“太疯狂了,当时我一直以为是胡安-马塔踢的我,回到更衣室我也是这么认为的,还一直在想这件事。然后我的同伴告理流程强协同,共筑跑道安全——管制中心组织开展跑道业务交流研讨会
中南空管局管制中心 赖长青 符豪为切实做好跑道安全工作,落实好中南空管局2020年防跑道侵入安全教育月活动相关工作要求,管制中心华北空管局技术保障中心编制完成终端管制中心设备供电资料图工作
通讯员:马思扬)近日,华北空管局技术保障中心编制完成新终端设备供电资料图。终端管制中心设备很多,分布于两个楼层的58个机柜和40个席位。在梳理过程中,技术人员仔仔细细排查每一个机柜和席位中的电源接线板华北空管局技术保障中心积极开展西跑道校飞工作
通讯员:周士勇)2020年8月25日—10月14日首都机场西跑道进行了跑道面改造,由于场地环境发生了较大变化,西跑道2套仪表着陆系统需重新校飞才开放。华北空管局技术保障中心积极组织技术力量替补2分钟建功!B费角球助攻,小麦头球破门
2月2日讯 英超第22轮,曼联客场对阵狼队。比赛第75分钟,B费右侧开出角球,刚替补登场2分钟的麦克托米奈头球破门,曼联3-1领先!标签:狼队揭秘野史中为何要掩盖刘娥妄图称帝的事情呢
一般说来,在野史当中比较能够看到一些历史的真相,毕竟相对官方史书,作为私人文字,不必有太多的约束。当然,野史也往往因为有个人偏见,或者见识局限,往往不能准确把握真相。不过,在历代史料笔记中,以宋人笔记珠海进近管制中心顺利完成信息系统安全自查及隐患整改专项工作
近日,珠海进近管制中心技术保障部门按照民航局空管局信息系统网络安全检查的要求,联合中心网信办,对中心网络和信息安全工作进行了自查,并顺利完成整改工作。技术保障部严格按照《民航网络与信息安全自查表》和《