类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
5
-
浏览
1
-
获赞
442
热门推荐
-
国家博物馆五一展览 收藏资讯
【中华收藏网讯】从4月29日开始,我们迎来了为期三天的“五一”小长假,既是和家人欢聚的时光,也是出游、学习充电的好机会。在文化底蕴深厚的北京,像故宫博物院、中国国家博物馆、中国美术馆、首都博物馆,都有TNF 北面全新中国新年专属限定系列即将登陆,牛年限定
潮牌汇 / 潮流资讯 / TNF 北面全新中国新年专属限定系列即将登陆,牛年限定2021年01月06日浏览:5381 挥别 2020 迈入 2021,今回户外专家THE“煤矿大脑” 领航,开启煤矿安全生产智能时代的新征程
近年来,随着科技浪潮以及对安全生产重视程度的与日俱增,人们对煤矿安全管理的关注骤增。“智能化”、“自动化”、“无人化”,这些热门ISSEY MIYAKE x 横尾忠则全新联名夹克系列上架发售
潮牌汇 / 潮流资讯 / ISSEY MIYAKE x 横尾忠则全新联名夹克系列上架发售2021年01月10日浏览:3084 由设计师三宅一生成立的同名品牌ISSEY恩捷股份(002812)固态电解质技术交流会:已建成硫化锂百吨级中试产线
11月14日,恩捷股份002812)线上召开固态电解质技术交流会。会议上,恩捷股份就固态研发进展、技术优势、专利布局等进行了分享和交流。恩捷股份提到,公司2021年开始布局硫化物电解质材料领域,成立控国家发展改革委:总体看来能源供应保障具有较好基础
国新办举行新闻发布会,介绍“系统落实一揽子增量政策,扎实推动经济向上结构向优、发展态势持续向好”有关情况。国家发展改革委副主任李春临在会上表示,关于能源保障。国家发展改革委已会兰帕德贡献第200球 切尔西2
英超第30轮一场焦点战在斯坦福桥球场展开抢夺,切尔西主场2比0取胜西汉姆,兰帕德打入为切尔西效能第200球,阿扎尔传射建功。切尔西主场4连胜反超热刺1分回到前三。双方近34交锋切尔西19胜5平10负,「达肤妍修护之旅」携手「温仙女」以精简之力,愈见沙漠之美
每一寸土地都孕育着独特而坚韧的生命,在腾格里沙漠中,一场关于“沙漠肌”修复与关怀的旅程已经悄然开启。2024年9月,达肤妍正式踏上“达肤妍修护之旅”的第三站,让达肤妍「缝隙生花 · 愈见精简」的修护力曝国安发工资也出现问题 费南多不会再为中国比赛
曝国安发工资也出现问题 费南多不会再为中国比赛_球员www.ty42.com 日期:2021-10-06 23:01:00| 评论(已有305677条评论)投资者紧盯美联储!黄金价格会迎来重大突破吗?
汇通财经APP讯——周二10月8日),现货黄金在经历了短暂的回调后,转为小幅上涨,目前金价报2647美元/盎司,较日内低点上升0.18%。当前市场的焦点仍然集中在不断升级的中东局势以及美联储政策制定者外科办公室与毕业后教育部联合召开外科住院医师管理大会
7月22日晚,在胆道外科医生办公室,外科办公室与毕业后教育部联合召开了全体外科住院医师的管理大会。会议由外科住院医师负责人、胆道外科叶辉主任主持,到会的老师包括毕业后教育部王星月部长和杨洋老师,大外LeBron 18 鞋款全新圣诞节「X
潮牌汇 / 潮流资讯 / LeBron 18 鞋款全新圣诞节「X-Mas in LA」配色发售详情释出2020年12月27日浏览:2803 早前,Nike 为庆祝圣诞新瑜之美运动用品有限公司(瑜美国际简介)
瑜之美运动用品有限公司(瑜美国际简介)来源:时尚服装网阅读:1694iFresh博览亚果会38毫米差不多相当于一个砂糖橘的直径,山竹也差不多.38mm便是8厘米。毫米millimeter),又称公厘或胃癌病人癌组织与外周血中的胃癌肿瘤干细胞被捕获
近日,四川大学华西医院的胃肠外科中心、干细胞生物学实验室和肿瘤科组成的研究小组从胃癌病人的胃部癌组织和病人的外周血样本中鉴定与扩增出胃癌肿瘤干细胞。该研究的成果经自由投稿与评审,以干细胞生物学实验室科米蛙 x 阿迪达斯联名 Stan Smith 绿尾鞋款即将登场
潮牌汇 / 潮流资讯 / 科米蛙 x 阿迪达斯联名 Stan Smith 绿尾鞋款即将登场2020年12月20日浏览:3112 风靡全球的可爱表情包 - 科米蛙最近也收