类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
68685
-
浏览
982
-
获赞
7
热门推荐
-
被阿扎尔踢的球童:当时我以为是马塔干的,他们告诉我是阿扎尔
2月1日讯 近日切尔西功勋阿扎尔与当年被他踢的球童查理-摩根重聚,两人畅谈往事。查理-摩根说:“太疯狂了,当时我一直以为是胡安-马塔踢的我,回到更衣室我也是这么认为的,还一直在想这件事。然后我的同伴告提高官德当从“选人”做起
新闻回放国家公务员局近日发布《公务员职业道德培训大纲》。“十二五”期间,我国全体公务员将进行职业道德轮训,培训时间不少于6学时。根据该大纲要求,“十二五”时期,全体公务员将轮训一遍,培训时间不少于6学究竟是什么原因?竟能让安禄山自信到对唐朝起兵造反
熟悉历史的朋友们可能就会知道,在一些特定的历史时期,受到特定的历史环境的影响,很可能就会衍生出一些特殊性的历史事件。比如说一些民间起义。我们一般常见的起义,大多发起于,乱世之中,或者是在长期的压力迫使“供港蔬菜”受追捧是因严格监管
在绿色蔬菜、有机蔬菜已被消费者熟知的情况下,目前珠三角地区部分超市又开辟了一个新的蔬菜专区——“供港蔬菜”,颇受青睐。记者走进“供港蔬菜”基地,全程了解其生产监管体系,希望对提高“菜篮子”质量安全水平华商储备商品管理中心再次向市场投放中央储备肉
根据商务部、发展改革委、财政部和中国农业发展银行的通知要求,2016年1月22日,华商储备商品管理中心再次组织实施了出库竞价交易。此次交易挂牌中央储备冻猪肉总量1.26万吨, 提货库点为浙江华统肉制品上市银行收益“鹤立鸡群”并非好事
三季报披露已接近尾声,从已披露数据看,上市公司盈利水平普遍出现下滑背景下,上市银行无论是营业收入、净利润还是增长率,都再一次做到“鹤立鸡群”。净息差再度成为带动银行业绩创出佳绩的主要推动力。统计显示,武则天的亲姐姐是怎么死的?为何有人会说是被武则天杀的?
武则天是中国历史上唯一一位女皇帝,她虽说没有唐太宗、康熙帝那样受到世人高度赞誉,但也算是一位明君。可抛开政治不谈,她的私生活一直都充满争议,这也大概就是为什么她死后立的功绩碑,是一座无字碑”的原因吧。明朝设立的司礼监有什么权利?为何在十二监中素有“第一署”之称?
明朝设立的司礼监有什么权利?为何在十二监中素有“第一署”之称?今天我们就来探究一下司礼监在明朝初期没有什么权利,但为何到了中后期的时候就能够在朝堂上一手遮天?司礼监,明朝时期设立,是明朝内廷管理宦官以日潮 MMJ x Medicom Toy 联名“暗黑系”BE@RBRICK 玩偶亮相
潮牌汇 / 潮流资讯 / 日潮 MMJ x Medicom Toy 联名“暗黑系”BE@RBRICK 玩偶亮相2020年02月23日浏览:5748 早前携手 Bape中俄少年足球赛踢成0:15,输的不仅是颜面
10月24日,北京地坛小学足球队与俄罗斯伊尔库茨克州少年迪纳摩足球队踢了一场友谊比赛,结果以0:15惨败。这个刺眼的结果,也在互联网上引起广泛讨论。为挽回颜面,北京小学足球冠军队——南湖东园小学越野队读懂贪官眼泪,更要多读百姓眼泪
原中山市长李启红的案子,昨天判了,李启红哭了。广州中院一审判处李启红犯内幕交易、泄露内幕交易罪及受贿罪,决定执行有期徒刑11年,罚款2000万元、没收财产10万元。同时接受判决的还有李的丈夫林永安、弟发暧昧短信被免职的潘局的悔过书
尊敬的各位领导、各位看客: 本人姓潘,原是江苏省宿迁市宿豫区农机局局长,俗称潘局。只因偶然手机丢失,31日上午,一个捡到手机的好事者把我和一位“女子”打情骂俏的暧昧短信截成图片在网上曝光,舆论哗然,导10月家电线下市场:彩电零售额规模同比上涨82.1%
10月彩电线下零售额规模同比上涨82.1%;均价为7909元,同比上涨23.9%。11月16号消息,奥维云网最新公布了10月家电市场总结。根据数据来看,10月彩电线下零售额规模同比上涨82.1%;均价“越狱”,何为能公开何为不能公开
据《新京报》报道,河南省司法厅证实,从河南省豫北监狱越狱的董云海在逃亡6天后已被捕。通稿证实,董云海越狱系“翻越监狱围墙脱逃”。但对于为何越狱和如何越狱,通稿只字未提。对逃犯“为何越狱和如何越狱”的披房价已步入实质性下行周期
9月29日,国务院常务会议特别强调“坚定不移地搞好房地产调控”,而且,在正式文件中首次用“促进房价合理调整”等更加明确的政策表述。笔者认为,在政策层面,房地产近期几乎不可能松动,中国房地产正式步入了实