类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
8375
-
浏览
83681
-
获赞
73872
热门推荐
-
maxmara六大经典款(maxmara六大经典款大衣介绍)
maxmara六大经典款(maxmara六大经典款大衣介绍)来源:时尚服装网阅读:6853maxmara是什么品牌?这款版型的大衣真绝了1、MaxMara是一个意大利品牌,始于1951年,创办人Ach我院举办华西创新130院士论坛暨华西创新130成果表彰
11月3日下午,在四川大学华西医院建院130周年之际,华西创新130院士论坛和华西创新130成果表彰在厚德楼多功能厅举行。樊代明、郑树森、程京、葛均波、卞修武、姜保国等6位院士分别通过线上线下方式参会海口美兰国际机场“职场幸福力”提升沙龙活动圆满完成
10月9日下午,美兰机场EAPEmployee Assistance Program,即“员工帮助计划”)协会组织约50名机场员工在逸唐飞行酒店会议室开展了第四期“职场幸福力”提升沙龙活动。刘璋迎刘备入川 为什么非得亲自去接呢?
刘备人情世故上的老辣,在上了年纪后,可谓是炉火纯青,一则张松在曹操那里回来,他马上去接,连陪三天,说起来容易啊,如果是曹操连陪张松三天呢,你觉得可能吗?再则,各位想想,如果你去一地游玩,正好那里是你同凶狠!马内飞铲科特迪瓦中场桑加雷染黄,后者被担架抬下场
1月30日讯 非洲杯1/8决赛,塞内加尔主场对阵科特迪瓦。比赛第9分钟,马内飞铲科特迪瓦中场桑加雷染黄,后者被担架抬下场。标签:科特迪瓦青海空管分局进近管制室“无限守候”班组开展“真人CS”活动
中国民用航空网通讯员尹瑞辰讯:近日,青海空管分局管制运行部进近管制室“无限守候”班组开展了真人CS活动。活动当天,参与活动人员在指定地点集合后,通过专业人士的指导与讲解,换上了一身“酷炫”的装备,每个青岛新机场转场工作联席会第一次会议顺利召开
为了青岛新机场转场工作的顺利推进,10月9日,民航青岛监管局组织青岛辖区各相关单位,召开青岛新机场转场工作联席会第一次会议。民航青岛监管局李平局长、吕君良副局长,机场集团熊剑波总经理、王祥群副总经理,白云机场货站安检查获新型违禁品钢丝棉
(图文:孙悦)10月10日,广州白云机场货站安检员在一件前往TLL的货物里首次查获新型违禁品钢丝棉,共2件。当日22时50分左右,机场货站安检员在使用X光机检查仪检查TLL航班货物时,发现其中一件货物福建福清 8月份立案查处15起食品类违法案件
中国消费者报福州讯记者张文章)为落实好创建食安示范城市迎检工作任务,福建省福清市市场监管局迅速行动、真抓实干,切实保障人民群众“舌尖上的安全”,全力以赴打好食安创城迎检攻坚战。海南空管为急救乘客开辟空中绿色走廊
近日,民航海南空管分局三亚区管中心成功处置一起机上旅客急救航班,三亚区管中心管制员精心指挥、积极协调、密切配合,为机上出现流产症状的孕妇赢得宝贵的生命时间。当日晚21时许,三亚区管中心AR11扇区管制西南空管局网络公司赴成都航空开展设备巡检及服务保障交流
通讯员 黄金虎)9月27日,西南空管局网络公司副总经理文富友及相关业务部门人员赴成都航空开展节前设备巡检及运行保障交流。网络公司技术人员首先对成都航空相关空管业务系统设备进行了检查维护,同时网络公司就庆祖国七十周年华诞 保大连进近空域平安
今年是祖国母亲七十华诞,在这个张灯结彩的节日里,大连进近为保证十一期间航班的安全顺畅,合理安排值班力量,各级领导亲临现场指导工作,用责任和担当为民航航班保驾护航,以骄人的安全业绩,向祖国献礼。国庆期间绮籽品牌简介(绮籽女装官网)
绮籽品牌简介(绮籽女装官网)来源:时尚服装网阅读:5808绮籽的读音拼音:qǐ 简体部首:纟五笔:XDSK总笔画:11笔顺编码:フフ一一ノ丶一,フ一, 解释:有文彩的丝织品:~罗。纨~。~襦纨绔。绮籽华北空管局通信网络中心集体观看《中国机长》
通讯员:张雪)喜迎新中国70华诞,进一步强化空管职业精神教育,增强职工对空管事业的自豪感、责任感、使命感。近日,华北空管局团委组织青年团员在后沙峪华彩影城观看《中国机长》,网络中心8名青年团员参加了观乌鲁木齐航空2019年冬春季航线指南
通讯员 马玉薇)2019年10月27日,民航将迎来2019年冬春航季。根据冬春航季旅客出行需求及特点,乌鲁木齐航空进一步优化航班时刻和航线网络,将新开博鳌=济南=大连航线,复飞博鳌=重庆航线、乌鲁木齐