类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
26255
-
浏览
4
-
获赞
5
热门推荐
-
全满贯!法国集齐四大冠军头衔 欧洲杯折戟后正名
全满贯!法国集齐四大冠军头衔 欧洲杯折戟后正名_决赛www.ty42.com 日期:2021-10-11 06:01:00| 评论(已有306286条评论)防汛减灾 及时配送
通讯员 程克华)“宁可备而不用,不可用而无备”,近日,天津空管分局的防汛工作在紧锣密鼓筹备中,为落实做好防汛物资的采购及储备等工作,后勤服务中心高度重视,防汛物资采购工作也乌鲁木齐国际机场分公司安全检查总站开展“战酷暑、保安全、送清凉、暖人心”活动
通讯员:张文瑶 王强)炎炎夏日送清凉,丝丝关爱入心田。近日,乌鲁木齐的温度居高不下,乌鲁木齐国际机场的旅客量也在逐步提升,为持续保障坚守在一线员工的身体健康,乌鲁木齐国际机场分公司安全检查总站开展&l世界上真的有神仙吗 道教升仙佛教升神真实性
世界上真的有神仙吗,道教升仙佛教升神是真的吗。这个问题很多人都是相信的,因为不能用科学解释的事情实在太多了。在目前我们的认知阶段里,有一种可以不能用科学解释的叫玄学。那么玄学和神仙有什么联系吗?中国古第三季度耳机线上传统电商平台:量额双高增
第三季度中国耳机线上传统电商平台销量为2990万副,同比增长26.8%;销额为51.6亿元,同比增长20.8%。11月13号消息,洛图科技公布了2024年第三季度,中国耳机线上传统电商平台不含拼抖快等英国人回忆:光绪皇帝在宫中竟然被太监鄙夷
导语:谁都知道,光绪皇帝之所以能继承大统,是因为慈禧太后想要继续掌握朝政大权。这就从一开始就注定了,光绪虽然身为皇帝,也只不过是个傀儡摆设而已。那么,光绪在皇宫中的真实地位如何呢?慈禧和众宫女太监又是揭女皇武则天在选择男宠方面有什么特别讲究?
权力,是男人的伟哥,也是女人的催情剂,而且地位越高、权力越大,这种来自身心的蠢蠢欲动就越强烈。那么,武则天在选择男宠方面有什么讲究呢?图片来源于网络武则天的男宠都是美男。薛怀义“伟形神,有膂力”(《旧主动加班排故障,雷雨季节保安全
近日,江苏空管分局气象台设备信息室值班员在例行巡检过程中发现,气象雷达监控软件出现“天线撞下限位”告警,气象雷达停止工作。临近下班点,面对突发的设备故障,设备信息室主任钟刘军,中粮各上市公司2015年11月9日-11月13日收盘情况
中粮集团旗下各上市公司2015年11月9日-11月13日收盘情况如下:11月9日11月10日11月11日11月12日11月13日中粮控股香港)06063.193.083.033.152.95中国食品香哈密机场开展助航灯光系统隐患排查工作
通讯员:张耘瑞)针对夏季高温与近期恶劣天气频发等特殊情况,为确保航班保障运行安全,哈密机场对助航灯光设备进行了一次全面的隐患排查工作。 为更好更快的开展工作,哈密机场中心电站结合《民用机场飞行区民航青海空管分局气象台党支部开展“我是安全吹哨人”主题党日活动
中国民用航空网讯 (文/赵刚) 6月16日,民航青海空管分局气象台党支部开展“我是安全吹哨人”的主题党日活动。本次主题党日活动主要从三个方面开展,一是上级文件精神学习,二是安全调研研讨,三是气象台党揭秘:千古一帝”的康熙爷身高只有一米五?
导语:几乎所有有都希望自己有一副高大威猛或纤细苗条的身材,如果再配上清秀俊美的容颜,那简直就是完美。可惜的是,世界上没有多少人同时拥有这两项条件。但是,这并不意味着人生的失败,反而世界上很多的帝王级的国足吉达首训未安排分组对抗 封闭条件不理想保守战术秘密
国足吉达首训未安排分组对抗 封闭条件不理想保守战术秘密_训练基地www.ty42.com 日期:2021-10-11 11:31:00| 评论(已有306363条评论)揭秘汉武帝推行的推恩令和削藩的区别在哪
汉武帝时期曾经推行过一部和诸侯封地继承有关的法令,这就是推恩令,它的出现成功解决了关于诸侯势力过大的问题,那么推恩令是谁的提议呢?这个人又有什么特点呢?图片来源于网络关于推恩令是谁的提议这个问题,史料以赛促学,提升技能——克拉玛依古海机场成功举办职业技能竞赛
通讯员俞静)为全面检验各岗位技能技巧水平与实际操作能力,激励员工努力提升自己的专业技能,形成“比、学、赶、超、帮”的良好氛围。6月20日下午15点,克拉玛依机场举办安检职业技能