类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
37
-
浏览
69
-
获赞
62
热门推荐
-
大悦城地产斩获中国商业地产行业发展论坛多项大奖
3月16-18日,中国商业地产行业发展论坛2016第十三届)年会暨“天府之夜”颁奖盛典在成都召开。大悦城地产荣获“中国最具价值商业地产开发商”奖项。本次贝巴表态盼今夏离开曼联 宣称买断自己只需500万
7月16日报道:新赛季关于曾经夺得英超金靴的贝巴来说并不是充满愿望的,由于他曾经很难在曼联找到出场机遇,昨晚,这名曼联3075万镑标王地下表现,他愿望有球队可以买走他。《太阳报》:贝巴盼离开曼联在曼联最高法公布侵犯公民人身自由赔偿金标准:每日462.44元
根据国家统计局2024年5月17日公布数据,2023年全国城镇非私营单位就业人员年平均工资数额为120698元,日平均工资为462.44元。近日,最高人民法院下发通知,要求自2024年5月20日起作出黄金积极势头回归上破50日均线,交易者关注美联储会议纪要
汇通财经APP讯——周三7月3日)欧盘时段,金价走高,突破此前作为阻力位的50日移动均线。交易员正密切关注美联储(Federal Reserve)会议纪要的发布,寻求对可能降息的洞见。美联储主席杰罗姆中国一线女鞋10大品牌(中国一线女鞋10大品牌名字)
中国一线女鞋10大品牌(中国一线女鞋10大品牌名字)来源:时尚服装网阅读:6919求告知,国内一线女鞋品牌都有哪些?红蜻蜓、百丽、达芙妮、千百度女鞋、TATA女鞋,这些都是国内一线女鞋品牌,款式也都很英夏季转会性价比最高11人阵容:朴智星领衔 欧洲名将
新浪体育讯《运动生活》网站列出了夏季转会至今、英格兰各级别联赛中性价比最高的引援阵容,从曼联(微博)转会女王公园巡游者的朴智星是其中最响亮的名字,而热刺签下的阿贾克斯(微博)名将维尔通亨也十分令人等待《燧石枪:黎明之围》进厂压盘 20分钟演示放出
由A44 Games开发的动作RPG游戏《燧石枪:黎明之围》已正式压盘,并将于7月18日登陆Xbox Series X|S、PS5和PC平台。Kepler Interactive发行的这款游戏讲述了主新航迫降客机舱内画面曝光:空姐脸上有血迹,餐食散落一地
当地时间21日,新加坡航空一客机在从英国希思罗机场至新加坡樟宜机场途中遭遇严重颠簸,于15时45分改航备降曼谷素万那普机场。据泰国媒体报道,目前,机上死亡人数上升至2人。涉事客机为一架波音777-30中粮各上市公司2015年11月9日-11月13日收盘情况
中粮集团旗下各上市公司2015年11月9日-11月13日收盘情况如下:11月9日11月10日11月11日11月12日11月13日中粮控股香港)06063.193.083.033.152.95中国食品香三峡大坝旅游区上半年共接待游客150万人 创历史新高
(资料图片仅供参考)据统计,截至6月30日,三峡大坝旅游区今年共接待游客150万人,较历史最高年份2019年同期增加5万人。春节以来,三峡大坝旅游区积极开展“研学旅游”“红色旅游”“文博+旅游”“生态《金庸武侠世界》定档预告 6月17日开播 陈都灵等主演
今日(6月11日)电视剧《金庸武侠世界》发布定档预告和海报,本剧将于6月17日18点在腾讯视频开播。定档预告:据悉,电视剧《金庸武侠世界》为系列单元剧,分为《铁血丹心》《东邪西毒》《南帝北丐》《华山论FIFA公布2021女足各奖项评审名单 陈婉婷入围
FIFA公布2021女足各奖项评审名单 陈婉婷入围_中国香港www.ty42.com 日期:2021-11-24 08:01:00| 评论(已有315436条评论)武磊赛后称绝杀球自己没碰到 裁判依然将其算在武磊账下
武磊赛后称绝杀球自己没碰到 裁判依然将其算在武磊账下_越南队www.ty42.com 日期:2021-10-08 03:31:00| 评论(已有305791条评论)荣耀Magic6至臻版将搭载金刚巨犀玻璃:五星抗刮耐摔
荣耀Magic6至臻版、 荣耀Magic6 RSR保时捷设计将配备荣耀金刚巨犀玻璃,基于第二代纳米微晶玻璃技术,是行业首款通过瑞士SGS多场景金标五星抗刮耐摔认证的手机屏幕玻璃。荣耀已经官宣,将于20外交部:对12家美国军工企业及10名高管采取反制措施
关于对美国军工企业及高级管理人员采取反制措施的决定2024年5月22日中华人民共和国外交部令第7号公布,自2024年5月22日起施行)一段时间以来,美国无视中方在乌克兰危机上的客观公正立场和建设性作用