类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
14711
-
浏览
3
-
获赞
269
热门推荐
-
阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿
潮牌汇 / 潮流资讯 / 阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿2020年02月17日浏览:3454 为迎接贝壳头诞生 50 周年,从去年环球时报:重设五一黄金周是中国新现实的呼唤
明天五一小长假就开始了。为了这个比正常周末多一天的三天假期,中国人本周连续工作了7天。有人发牢骚说,这样的多休息一天“不如不休”。尽管这是气话,但却反映了人们对这个小长假过得“有点累”的真实感受。中国谁给吸毒老人端去一碗“养心汤”
“抓到这些瘾君子,我们自己也很意外。”昨天,宁波市海曙公安分局禁毒大队公布了一起六名老人的聚众吸毒的案子。这些六十多岁的老人晚年生活单调,爱聚在一起打牌,为了能“提神”,一起吸上了毒。五年来,这些老人关于贺知章的轶事典故有哪些?他与李白相比谁的酒量更好?
贺知章,唐代诗人、书法家。字季真,晚年自号“四明狂客”、“秘书外监”。少时就以诗文知名。为人旷达不羁,好酒,有“清谈风流”之誉,晚年尤纵。下面趣历史小编就为大家带来详细的介绍,一起来看看吧!轶事典故(《指环王:洛汗之战》新视频 洛汗公主赫拉的故事
近日,华纳公布了指环王动画电影《指环王:洛汗之战》新视频,展示了动态海报和幕后制作花絮。洛汗公主赫拉,海尔姆等人亮相,一起来看看吧!全新视频:动画电影《指环王:洛汗之战》将于12月13日北美上映,由神不该鼓励警察行使终极审判权
东京地方检察官杜丘冬人因涉嫌偷窃、杀人被警方追捕,高仓健主演的杜丘当然是好人啦,他一边要应付警方的追捕,一边要继续追查真相,其间,他相识并救了富家美女真由美,还救了被黑熊袭击的警长矢村,矢村的大鬓角随一船碰擦南京长江大桥后沉没 18名船员全部获救
中新网南京5月12日电(张卫星 庞志东 朱晓颖)据南京海事局5月12日通报,5月12日4时20分许,一海轮碰擦南京长江大桥六孔与七孔之间的桥墩后,在大桥下游3.5公里处的北岸岸边浅滩处(八卦洲洲头)附外汇局:研究部署外汇政策支持保障抗震救灾
新华网北京4月21日电记者安蓓王培伟)记者21日从国家外汇管理局了解到,四川省雅安市芦山县发生7.0级地震后,外汇局研究部署抗震救灾相关的外汇服务和支持工作,全力保障抗震救灾工作。为全力支持抗震救灾及李铁:尊重和重视每一个对手 长期封闭对球员非常残酷
李铁:尊重和重视每一个对手 长期封闭对球员非常残酷_比赛www.ty42.com 日期:2021-10-06 23:31:00| 评论(已有305679条评论)南昌地震局为何不养一群蛤蟆
5月7日,网友在江西微博中爆料称,南昌市地震局大院内养若干条大狗,每晚11点必狂吠,周边居民不堪其扰,多次反应均无果。记者联系到南昌市防震减灾局防震监测预报处,一宋音)姓负责人称,地震局养两三条狗是为红会社监委重查“郭美美”可当真
中国红会认为是媒体闹了乌龙是红会社监委而非红会的建议中国红会社会监督委员会委员、新闻发言人王永此前表示,将重新调查郭美美事件,引起社会广泛关注。而中国红会秘书长王汝鹏最新在微博中澄清,红会没有任何人说重查郭美美事件是重建公信第一步
郭美美事件仍让公众对中国红十字会难以重建信任。中国红会社会监督委员会新闻发言人王永24日表示,将于5月中下旬重新调查郭美美事件。4月24日新华社)雅安地震期间红会的“埋头苦干”并未弥合长期被撕裂的信任黄金会跌破关键支撑位吗?避险情绪能否力挽狂澜!
汇通财经APP讯——周五(11月15日)尽管周四从两个月低点反弹,但金价在周五的欧洲早盘中再次承压,交易价格徘徊在2570美元附近。美元的持续走强以及市场对美联储降息步伐放缓的预期,对黄金构成压力。消李白与孟浩然第一次相见是什么时候?孟浩然与李白相差几岁?
李白(701年-762年),字太白,号青莲居士,又号“谪仙人”,是唐代伟大的浪漫主义诗人,被后人誉为“诗仙”,与杜甫并称为“李杜”,为了与另两位诗人李商隐与杜牧即“小李杜”区别,杜甫与李白又合称“大李阮子文:因地震倒塌的房子不应再偿还房贷
4月20日,四川省雅安市发生7.0级地震,这场地震摧毁了不少人的幸福家园。据报道,震中区域大概50%房屋倒塌。不少网友疑惑,如果是正在还月供的按揭贷款房子倒塌了或者成了危房,是否还要继续还月供?如果房