类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
5982
-
浏览
476
-
获赞
46254
热门推荐
-
lowa中国官方网站(lowa品牌介绍)
lowa中国官方网站(lowa品牌介绍)来源:时尚服装网阅读:7744lowa中文译音是什么lowa 释义:洛瓦中文译音)双语例句:C:I would like to make a reservati难言之隐痛 朱元璋是不是个民族英雄?
提起中国的民族英雄,大家很少会将它与朱元璋联系起来。但仔细想想,朱元璋在元末领导的改朝换代战争,实际上是把横扫亚欧大陆、有史以来最强大的蒙古帝国打垮了。他将蒙古人赶回了草原地区,中原王朝重新回到了汉人揭秘:秦始皇陵地宫“水银之谜”
导读:自从秦陵地宫被挖掘以后,许多问题接踵而来,人们对于秦始皇更加好奇。在已开发的秦陵地宫中,考古学家发现了大量的水银,这水银背后藏有怎样的秘密呢?2002年4月,我国首次对秦始皇陵进行地下考古勘察工共惜地球水,共护地球美
南极五年1.5万亿吨冰融化,中东干旱地区遇历史罕见特大暴雨,英国连遭两个超级温带气旋袭击,损失惨重;非洲地区降水异常偏多,沙漠蝗泛滥,东非及红海部分地区农业几乎颗粒无收......充斥在今年报章杂志中耐克 Dunk Low 雪城大学配色“Syracuse”鞋款迎来复刻
潮牌汇 / 潮流资讯 / 耐克 Dunk Low 雪城大学配色“Syracuse”鞋款迎来复刻2020年02月15日浏览:7625 NikeDunk 系列最初的定位即是李清照曾经是否有过再婚的经历?
李清照相信大部分读者都知道她是宋代女词人,婉约词派代表,有“千古第一才女”之称。但是有很多读者不明白的是明清文人为什么力主李清照不曾再婚呢?在丈夫赵明诚去世之后,李清照曾经有过再婚经历,这事在宋人著作郑州进近持续开展扇区西扩工作
随着河南航空事业飞速发展,郑州进近管制室持续开展进近扇区西扩工作。预计扇区西扩工作完成后能有效缓解目前状况,也为进近第四扇运行实施提前做好了规划。郑州进近在开展扇区西扩工作的同时,时刻保持着严谨认真的狄仁杰效忠武则天很“纠结”:曾被亲戚嘲讽
说到狄仁杰就不得不提武则天,武则天作为中国历史上唯一一个正统的女皇帝,狄仁杰对于武则天的态度用于赓哲的话说,“纠结”。网络配图 “他刚开始对于武则天还是支持的,他肯定武则天的能力,纵观当时全天下有能力卡哇伊新战靴 New Balance Kawhi 首次曝光,手掌纹理抢镜
潮牌汇 / 潮流资讯 / 卡哇伊新战靴 New Balance Kawhi 首次曝光,手掌纹理抢镜2020年02月17日浏览:4453 卡哇伊刚刚拿到了全明星“Kobe同心抗“疫”,守“备”无患
疫情期间,保障气象设备的正常运行是每一名空管气象设备人员的责任与担当。近日,河南空管分局气象设备室组织人员对外场自观设备进行定期维护,先后完成了前向散射仪的校准、风廓线雷达系统维护和云高仪的窗口清洁等千年迷雾:揭一代战神霍去病死亡之迷
导读:霍去病,一生数次指挥大军与匈奴会战,每一仗均是孤军奋战,每一仗均是以寡敌众,最终大胜而归!然而,这位集万千宠爱于一身的天之骄子,却在他二十三岁的时候突然划上了生命的句号,千百年来使无数后人为之扼乌拉特中旗“五一”期间恢复至呼和浩特航线
本网讯乌拉特中旗机场:王思桑报道)5月1日上午9时10分,一架银白色的PC-12型飞机满载8名旅客腾空而起,标志着乌拉特中旗—呼和浩特往返航线正式恢复运行,恢复运行首日,航班客座率达到了88.9%。为大悦城地产斩获中国商业地产行业发展论坛多项大奖
3月16-18日,中国商业地产行业发展论坛2016第十三届)年会暨“天府之夜”颁奖盛典在成都召开。大悦城地产荣获“中国最具价值商业地产开发商”奖项。本次飞行员眼中的“三个敬畏”
在这个发展越来越迅速,各方面要求越来越高的时代,国家各行各业都在接受新的考验。民航业飞速发展的同时,其伴随的风险也大大提升,许多规章政策相应而生。疫情当下,国家很多行业都受到一定冲击,这不光对于国家和广西空管分局顺利完成民航通信网TDM网IP地址优化工作
为了积极稳妥的推进民航通信网业务迁移工作,确保现有各项业务平稳过渡至民航通信网TDM网,5月1日-2日,广西空管分局技术保障部通信枢纽室积极响应中南空管局的组织安排,开展对民航通信网TDM网中南部