类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
71561
-
浏览
17345
-
获赞
26692
热门推荐
-
迟京涛会见古巴内贸部副部长
10月9日,集团副总裁迟京涛在中粮广场会见了古巴内贸部副部长Odalys Escandell Garcia(奥黛丽丝·加西亚)一行,双方就大宗商品批发和销售等事宜进行了探讨。迟京涛代表中华为预热Mate XT非凡大师:拥有三种折叠方式
透过于和伟的预热视频可以确定,华为Mate XT非凡大师手机为三折叠手机,展开屏幕面积很大,并且十分轻薄,纹理上档次,拥有三种折叠方式。视频的最后,于和伟不禁感慨,“三折叠,太妙了。”华为已经官宣,将《华西论健》讲解疼痛知识获好评
为了让广大群众能正确地认识和评估疼痛,疼痛科护士长刘俐6月2-3日,参加了四川电视台公共频道《华西论健》节目,讲解了如何正确认识疼痛和评估疼痛,节目播出后获得一片好评。随着人们生活质量的提高,疼痛官方:比利亚雷亚尔免签马赛后腰帕普盖耶,签约至2028年
7月5日讯比利亚雷亚尔官方消息,塞内加尔国脚后腰帕普-盖耶自由转会加盟球队,签约至2028年。25岁的盖耶出自勒阿弗尔青训营,此前效力于马赛,他与俱乐部的合同在6月30日到期,现在自由身加入黄色潜水艇数智赋能驱动融合创新,远光软件亮相2024电力数字化大会
11月6日至7日,2024电力数字化大会在北京举行。大会以“创新驱动、数智引领”为主题,聚焦数字技术在电力行业企业的融合创新应用。中国工程院院士、清华大学教授郑纬民等专家和电力微软 GitHub 收购一个付费代码工具,然后免费开放了
【 图片来源:The GitHub Blog 所有者:The GitHub Blog 】雷锋网消息:2019 年 6 月 17 日,微软宣布收购 GitHub 工具供应商 Pull Panda,具体收《凉宫春日》系列将于8月31日中午发布新消息
8月30日,《凉宫春日》官方X宣布将于8月31日中午12:00公布新消息,原贴文配图中的文字写道:“明天8月31日,中午12:00,禁止迟到”。值得一提的是,有粉丝指出,8月31日这个日期和贴文配图中LCD屏彻底落幕 苹果iPhone SE4将配OLED屏幕
根据一份新报告显示,下一代iPhone SE也将配备OLED面板。苹果在高端iPhone手机中,早就开始使用OLED屏幕了,这种屏幕厚度更低,有助于苹果打造纤薄手机设计。不过在廉价的iPhone SE分析师:黄金中期上涨趋势已被破坏,需要时间重燃涨势
汇通财经APP讯——黄金今年表现出色,创下每盎司2790美元的历史新高,从2月份的低点上涨了40%以上,但一位分析师表示,中期上涨趋势已被破坏,宏观经济因素可能需要一段时间才能重新点燃黄金的涨势。OA动画《终结者:零》预告 8月29日重燃末日之战
Netflix动画剧集《终结者:零》今日发布全新预告! 这部由“攻壳机动队”制作公司「I.G动画制作」打造的动画剧集,将带你重返《终结者》的世界,体验一场跨越时空的末日之战! 动画《终结者:零》预告:华阳新材料泊里公司500万吨/年选煤厂项目开工
9月2日,华阳新材料集团泊里公司500万吨/年选煤厂建设工程总承包(EPC)项目正式开工。据了解,泊里公司矿建配套项目500万吨/年选煤厂建设工程采用EPC总承包模式,牵头单位为宏厦三建,联合体成员单陕西西安:市场主体登记注册“跨区办理”进入2.0时代
中国消费者报西安讯记者徐文智)记者从陕西省西安市市场监管局了解到,从12月1日开始,西安在全市范围内推行企业登记注册“同城通办”及跨区迁移网上办理工作。2020年以来,西安市市Air Max 90 全新橙黄迷彩配色鞋款预览,联名气质浓厚
潮牌汇 / 潮流资讯 / Air Max 90 全新橙黄迷彩配色鞋款预览,联名气质浓厚2020年02月26日浏览:2476 在看过了复活节彩蛋及城市限定系列之后,这边佩帅称曼城不学穆里尼奥 讽刺蓝军风格是小球队
5月2日报道:目前切尔西在英超积分榜上领先少赛一场的阿森纳13分,他们只需要在本周末击败水晶宫就可以提前夺得英超冠军。而切尔西主帅穆里尼奥也再次嘲讽了对手们,他先是讽刺阿森纳“10年没能获得英超冠军才曼城否认瓜帅今夏入主 买切尔西弃将恐需4500万
5月10日报道:欧冠半决赛首回合,拜仁3球惨败巴萨,再加上神医沃尔法特的离职风波,有媒体开始猜疑瓜迪奥拉今夏离开拜仁的可能性。日前甚至传出瓜迪奥拉已经与曼城达成口头协定的消息,不过曼城方面已经否认了这