类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
585
-
浏览
8628
-
获赞
17
热门推荐
-
中粮各上市公司2016年1月25日-1月29日收盘情况
中粮集团旗下各上市公司2016年1月25日-1月29日收盘情况如下: 1月25日1月26日1月27日1月28日1月29日中粮控股香港)06062.132.022.032.042.08中国食品香港)05喀什管理公司炎炎夏日送清凉 丝丝关爱暖人心
连日来,喀什地区高温天气“超长待机”,机坪热浪滚滚。面对“烤”验,喀什机场全体员工顶烈日、冒酷暑、战高温,挥汗如雨、履职尽责,始终坚守在机坪一线保障旅客慈禧最为人所诟病的竟是她为了养颜美容无所不用其极
一说起慈禧,我们最先想到的恐怕就是她置国家生死于不顾而只耽于个人享乐自私自利,在历史中,慈禧实际也是这样的一个人,慈禧喜爱珠宝是出了名的,金银首饰数不胜数,她一生荣华富贵,生活也是时尚超前的,在西方的韦后武三思秽乱后宫?武三思是如何被封为梁王的?
武三思简介武三思,是并州文水人,曾是周国宰相,女皇武后的之子。担任官右将军的兵部以及礼部尚书的职务同时还担任检修国史。在天授元年时期,武则天称帝,由于当时奉行外戚干政的政策,武则天大肆的封武氏宗族为王鲁尼:最喜欢合作的前锋是特维斯,我们互相欣赏
2月3日讯 近日在接受采采访及合作过的最喜欢的球员时,鲁尼表示是特维斯。鲁尼说:“特维斯,我喜欢我们之间的联系。我们两个在球队的前面,互相欣赏。”“通常如果与萨哈、范尼或者是范佩西搭档,他们这些前锋通喀什机场开展消防安全知识培训
通讯员 杨丹)为进一步贯彻“预防为主,防消结合”的消防工作原则,提高广大干部职工的消防安全意识,普及消防安全知识,确保机场安全平稳运行,7月14日,喀什机场组织开展消防安全知识南通星辰第二代高品质级PBT进入海外市场
日前,南通星辰推出的第二代高品质级PBT聚对苯二甲酸丁二醇酯)基础树脂已全面通过行业内某知名跨国企业认证测试,正式进入海外市场。作为行业领先的PBT产品供应商,南通星辰于2014年8月成功推出具有行业乌兰察布机场开展进近灯光维修保养工作
中国民用航空网讯乌兰察布机场:丁嘉伟报道)近日,乌兰察布机场飞行区管理部莱特班组完成对东,西进近灯具的全面检查。 为落实飞行区管理部专项安全检查的工作要求,乌兰察布机场电站莱特班组将东,西内所有进近灯中粮各上市公司2015年11月9日-11月13日收盘情况
中粮集团旗下各上市公司2015年11月9日-11月13日收盘情况如下:11月9日11月10日11月11日11月12日11月13日中粮控股香港)06063.193.083.033.152.95中国食品香这位皇帝一生浑浑噩噩,临死一件事却让他青史留名
历史上有这么一个皇帝,一生信任太监,被俘是因为太监,登上皇位也因为太监,一生被太监蒙蔽却死不悔改。杀害忠良却不思悔过。临终才做一件好事。他就是朱祁镇。大明朝宣德皇帝的嫡长子,是明朝第六位和第八位皇帝。反诈宣传进空港 安全防范入人心
中国民用航空网通讯员郑锦瑞讯:为有效预防和减少电信诈骗案件的发生,增强自我防护意识,守住广大员工的“钱袋子”近日,图木舒克机场地面服务部联合机场公安开展了“反史上代价最大的偷情,这皇帝因与嫂子私通成了亡国之君
如果不是因为和嫂子偷情,沮渠牧犍不会落到“面缚请降”《通鉴》的尴尬境地,北凉的灭亡也不至于来得那么快。历史就是这样残酷,一个看似不经意的偶然事件,却会像多米诺骨牌一样,产生一系列连锁效应,一着不慎,满类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,“视频生成模型到底懂不懂物理规律”受到热议,但业界一直未有研究证实。近日,字节跳动豆包大模型团队公布最新论文,研究历时8个月,围绕“视频生成模型距离世界模型有多远”首次在业界完成系统为何武则天如此长寿?4大男宠轮番滋补
武则天,名武曌,祖籍并州文水县,生于长安,中国历史上唯一得到普遍承认和众人皆知的女皇帝。唐朝功臣武士彟次女,母亲杨氏。十四岁入后宫为唐太宗的才人,唐太宗赐号“武媚”,唐高宗时初为昭仪,后为皇后,尊号为纵观廉颇一生,他最辉煌是在什么时期?
廉颇的故事廉颇是赵国的将领,因为骁勇善战为赵国立下赫赫战功,后人也将廉颇称为战国时期四大名将之一。纵观廉颇一生,他的辉煌时期,莫过于赵惠文王在位时期。廉颇雕塑廉颇因骁勇善战得到赵惠文王的认可和重视,将