类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
43
-
浏览
62
-
获赞
42976
热门推荐
-
阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿
潮牌汇 / 潮流资讯 / 阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿2020年02月17日浏览:3454 为迎接贝壳头诞生 50 周年,从去年华北空管局技保中心完成应急遥控盒换季维护工作
(通讯员:饶家兴、金睿)4月20日,为完成终端设备室应急遥控盒换季计划,同时保证4月24日、4月25日北京终端区备份内话系统FRQ7.1 Rev15软件升级期间应急手段的正常使用,华北空管局技保中心终华北空管局技保中心完成应急遥控盒换季维护工作
(通讯员:饶家兴、金睿)4月20日,为完成终端设备室应急遥控盒换季计划,同时保证4月24日、4月25日北京终端区备份内话系统FRQ7.1 Rev15软件升级期间应急手段的正常使用,华北空管局技保中心终刘备入主益州之后法正为何要求他娶一个寡妇
大家都知道曹操风流成性,妻妾成群,相反,同为诸侯的刘备就没有这样好的命运了,因为刘备虽然妻子有不少,但是命中克妻,都死都身边只有一个妻子,而且是二婚的寡妇。刘备一生到底有多少女人,为什么刚占领益州就娶《如龙》真人剧花絮曝光 神室町场景完美还原
SEGA近日发布了《如龙》真人电视剧的幕后制作花絮视频,揭秘了剧组如何在现实中重现游戏标志性场景——神室町的幕后故事。 《如龙》真人电视剧制作花絮:视频展现了剧组在东京近郊大规模搭建神室町场景的幕后工喀什机场开展岗位技能竞赛
通讯员 李玉刚)为提升人身检查岗位人员查获违禁物品的技能水平,进一步深化班组“三基”建设,将“学技术、争一流、创效益、做贡献”作为抓基础、增实力、促发展湛江空管站开展道路交通安全及消防知识技能培训
为提高员工交通安全及消防知识技能,4月20日,湛江空管站组织开展了一次道路交通安全及消防知识技能培训。 本次培训分为两个部分进行。培训首先展示了一部道路安全警示教育片,该视频讲解了常见的顺治帝定下一条铁律 乾隆为满足私欲不遵祖训
乾隆时期,经过康熙、雍正两代帝王的经营,大清国库充盈,国力达到鼎盛,因此,乾隆爷继位后,在花钱享乐方面,手笔十分之大!乾隆在位时,曾六下江南饱览风光,别的不说,就是建造龙舟的费用,都是一笔相当惊人的开日潮 MMJ x Medicom Toy 联名“暗黑系”BE@RBRICK 玩偶亮相
潮牌汇 / 潮流资讯 / 日潮 MMJ x Medicom Toy 联名“暗黑系”BE@RBRICK 玩偶亮相2020年02月23日浏览:5748 早前携手 Bape李世民这么厉害,为啥儿子都这么渣?
唐太宗是中国历史上最杰出的皇帝之一,可谓牛气冲天,但他的儿子大多是渣。李治是个软蛋先不说,长子李承乾在被立为太子17年之后,竟然走上谋反的道路,不能不令人深思。历代史家都将李承乾悲剧形成的原因,完全归华北空管局完成终端管制中心管制楼UPS系统设备春季换季维护工作
通讯员:付伊健)根据华北空管局技保中心2023年春季设备半年维护工作部署,4月17日22点至18日凌晨2点,中心动力设备室终端电源班组按照换季计划和方案实施第二次停机,对终端管制中心直流供电系统和管制华北空管局技保中心开展内话资质排查培训工作
通讯员:李琦)4月18日,华北空管局技保中心塔台设备室按照中心资质排查工作小组计划安排,对内话资质排查大纲内容开展线上及线下培训,为下半年将要开展的内话资质排查做好准备。技保中心对此次内话资质排查高度赞达亚亮相2024摇滚名人堂典礼 太性感热辣了!
近日赞达亚性感亮相摇滚名人堂盛典,她这个造型也是致敬还原了雪儿奶奶Cher的经典造型。一起来欣赏下吧!«12»友情提示:支持键盘左右键"←""→"翻页英雄联盟服务器已满?教你如何轻松解决!
英雄联盟服务器已满的原因和解决办法:1. 原因:每个区域的额定数量都有上限,超过这个上限的玩家需要排队等待游戏中的玩家一个个退出,才能登录,这是为了保证游戏中玩家的游戏质量。2. 解决办法:选择低峰时笃行不怠 使命在肩—— 东航山东保卫部(空保管理部)开展安保协同专项培训
为近一步强化队员对航空安保的认识,提高空中突发特情处置能力,切实做好换季期间各项安全保卫工作,按照空保岗位工作要求,保卫部空保管理部)在青济两地,面向空保管理部全体空保人员开展安保协同专项培训。