类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
4413
-
浏览
1
-
获赞
58
热门推荐
-
福建福清 8月份立案查处15起食品类违法案件
中国消费者报福州讯记者张文章)为落实好创建食安示范城市迎检工作任务,福建省福清市市场监管局迅速行动、真抓实干,切实保障人民群众“舌尖上的安全”,全力以赴打好食安创城迎检攻坚战。中粮集团召开安全环保绩效评估体系培训会暨推进会
为深入学习贯彻国务院《关于进一步加强企业安全生产工作的通知》与国资委《中央企业安全生产禁令》,宣贯集团安全环保绩效评估体系标准,总结反思安全环保绩效评估试点实施情况,安排部署下一步工作,11月13日-Vivienne Westwood 2022 秋冬系列抢先预览~
潮牌汇 / 潮流资讯 / Vivienne Westwood 2022 秋冬系列抢先预览~2022年03月08日浏览:2693 红标支线的最新系列刚刚入场,近日西太后主记者:广汽邀李玮锋参与新广州城队运营 目前已到俱乐部
记者:广汽邀李玮锋参与新广州城队运营 目前已到俱乐部_足球俱乐部_集团_天海www.ty42.com 日期:2022-03-24 14:01:00| 评论(已有337428条评论)佳节至保食安 浙江宁波开展月饼流通领域检查
中国消费者报杭州讯记者郑铁峰)随着中秋佳节的脚步临近,节日氛围逐渐浓厚,超市、酒店等也在如火如荼地展开各式月饼的销售活动。如今的月饼口味多样、造型各异,创新形式的月饼层出不穷,例如冰皮月饼、流心月饼、罗伯逊本场数据:3关键传球+1创造重大机会,获评7.2分
6月20日讯 苏格兰在本轮欧洲杯1-1战平瑞士,出任左翼卫的罗伯逊本场数据如下:58次触球35次传球、28次成功,成功率80%3次关键传球8次传中、4次成功4次长传、2次成功1次创造重大机会1次过人、新疆太平洋建设召开2017一季度经管工作会
4月6日,新疆太平洋建设在淮安庄严智库召开2017年第一季度经营管理工作会议,分析、总结了第一季度工作,部署了第二季度工作目标、任务。 会议伊始,新疆太平洋建设董事局主席黄学东宣布在贵州六盘水项目落微星上新泰坦18 Pro 2024游戏本 旗舰配置售24999元起
微星上新泰坦18 Pro 2024游戏笔记本,搭载14代酷睿i9-14900HX处理器和RTX 4080/4090移动显卡,首发价24999元起。微星此前已经发布了新一代泰坦18 Pro 2024游戏耐克 Blazer Low 北卡蓝配色“UNC Blue”鞋款抢先预览
潮牌汇 / 潮流资讯 / 耐克 Blazer Low 北卡蓝配色“UNC Blue”鞋款抢先预览2020年02月15日浏览:3160 在看过了“Dorothy Gate切尔西VS狼前瞻:蓝军四将或首次先发 特里再轮休
9月25日报道:英格兰外地工夫本周二25日)晚19点45分北京工夫26日凌晨2点45分),2012-2013赛季英格兰联赛杯第3轮1/16决赛),切尔西将坐镇斯坦福桥球场迎战英冠球队狼队。交锋往绩:在Human Made x Girls Don’t Cry 春夏联名系列明日发售
潮牌汇 / 潮流资讯 / Human Made x Girls Don’t Cry 春夏联名系列明日发售2022年02月22日浏览:2936 与 Kid Cudi 的合国网冀北唐山:实现中低压分布式光伏柔性调控
6月17日,冀北唐山供电公司在分布式光伏功率控制平台通过“5G无线虚拟专网”安全接入区实现对380/220伏分布式光伏的柔性调控。目前,唐山地区分布式光伏装机容量达336.38007 x 阿迪达斯联乘鞋款上脚图首次曝光,邦德同款!
潮牌汇 / 潮流资讯 / 007 x 阿迪达斯联乘鞋款上脚图首次曝光,邦德同款! 2020年02月22日浏览:3390 近日,Adidas与 007 联乘Ultra B卡西欧全新午夜迷雾“Midnight Fog”腕表系列上市
潮牌汇 / 潮流资讯 / 卡西欧全新午夜迷雾“Midnight Fog”腕表系列上市2022年02月25日浏览:3125 前几日揭晓的 Paradise Youth C北京太平洋一集团与黑龙江黑河市经合区签约
4月7日,北京太平洋第一建设集团董事局主席王健闯一行应邀赴黑龙江省黑河市边境经济合作区考察,黑河边境经济合作区管委会主任、党工委书记王海东王海东予以接待,双方就黑河边境经济合作区部分基础设施建设项目