类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
71
-
浏览
69217
-
获赞
8
热门推荐
-
阿迪达斯全新 4D 鞋款 adidas ZX 4D Morph 实物曝光
潮牌汇 / 潮流资讯 / 阿迪达斯全新 4D 鞋款 adidas ZX 4D Morph 实物曝光2020年02月24日浏览:4550 采用 3D 打印锻造而成的 4D华北空管局气象中心工会中秋国庆双节前慰问一线职工
在中秋国庆双节来临之际,9月27日下午,气象中心党委副书记陈露、工会主席李晓斐带领女工委员、工会委员分别到气象一线值班室看望了一线生产岗位的值班人员,并为他们送去了节日的祝福和慰问品。慰问组一行先后探山东空管分局完成海格四信道甚高频天线共用系统安装工作
中国民用航空网通讯员邵鑫垚报道:经过一周的紧张施工,山东空管分局技术保障部终端运行室顺利配合厂家完成了本场新增扇区项目中海格四信道天线共用系统的安装工作,后续系统投入运行后将为管制运行提供新的地空通信吕不韦传奇:秦始皇的父亲到底是不是吕不韦?
历来的专家学者大都认为秦始皇的生父是秦庄襄王而不是吕不韦,主要的原因就是被《秦始皇本纪》中的“秦始皇帝者,秦庄襄王子也”这第一句话误导了。是拿棒槌当针(真)了。其实这句话是大有疑问的。这句话的疑窦就在中国食品发布2015年度业绩公告
3月22日,中国食品HK.00506)发布2015年度业绩公告。2015年,中国食品经营收入为278.42亿港元,同比增加6.1%;经营利润为6.2385亿港元,同比增加92%。2015年,中国食品不湖南空管分局完成广州区管甚高频设备回迁工作
通讯员刘峰报道: 8月25日至9月8号,湖南空管分局与中南空管技术保障中心、中南空管网络中心紧密协作,顺利完成了广州区域管制中心甚高频设备回迁岐山雷达站的工作。岐山雷达站是湖南空管分局位于长沙黄花国际东航江西分公司举办“我健康·我幸福”员工EAP微讲堂活动
9月16日,东航江西分公司以“我健康我幸福”为主题举办员工EAP微讲堂,邀请国家二级心理咨询师讲授职场减压,心态调节等技巧,40余名工会干部和员工代表参加。分公司自2017年成天津空管分局顺利完成西跑道光纤切改工作
通讯员 刘萍)近日,天津空管分局技术保障部通信网络室组织技术人员开展西跑道光纤切改工作,切实保障导航、气象业务传输的安全可靠。 此次切改工作涉及西跑道南/北航向、南/北下滑、DVOR台、气象观测Aimé Leon Dore 2020 春夏系列 Lookbook 赏析~
潮牌汇 / 潮流资讯 / Aimé Leon Dore 2020 春夏系列 Lookbook 赏析~2020年02月20日浏览:2905 在释出了新百伦 2020 全新加强三级建设 确保生产安全
企业安全在于根基是否牢固,这个根基就是企业内部的基层一线班组。为持续做好班组安全生产管理工作,打造素质过硬,使命与责任感皆优的班组团队,9月21日上午,广州白云机场消防安保管理中心雷达班组组织观看了消牢记安全使命 树立安全意识 ——海南空管分局三亚区域管制中心开展安全教育
自9月21日起,民航海南空管分局三亚区域管制中心连日开展了以案例分析、工作讲评等形式的安全教育。鉴于当前的安全形势和运行环境,结合有关案例,旨在加强安全从业人员的安全意识和做好民航空管安全保障工作。民白云机场消防开展先进灭火救援装备展
为提高广州白云国际机场消防救援装备水平,进一步提升科技装备水平,确保消防救援队伍以精良的装备、科学的手段应对灭火救援工作带来的挑战,白云机场消防一直注重对行业装备发展动态的掌握和对发展趋势的研判。9月前曼城财务顾问:切尔西必须迅速通过卖人赚1亿镑,否则很危险
2月3日讯 受到财务公平规则的限制,今年英超冬窗较为平淡,尤其是此前几个转会期投入巨大的切尔西。前曼城财务顾问斯特凡-博尔森谈到蓝军时表示:“虽然切尔西使用了摊销的伎俩,但在我看来他们的麻烦迫在眉睫,揭秘罗马皇帝奥古斯都屋大维是怎么死的?
屋大维是罗马帝国历史上最伟大的皇帝,他是罗马帝国著名的凯撒大帝的继任者,也是他的养子。在凯撒大帝被元老院刺杀以后他继承了位置,他的到来结束了罗马帝国的分裂状态,为罗马带来了两百多年的和平。屋大维塑像照中南空管局管制中心与技术保障中心完成广州终端区备用自动化系统工厂验收
中南空管局管制中心 赵南飞 史鑫 林彦嘉2020年8月25日至9月11日,技术保障中心技术人员联合管制中心相关人员,顺利完成了广