类Sora模型到底懂不懂物理?字节完成系统性实验证明
Sora爆火以来,模明“视频生成模型到底懂不懂物理规律”受到热议,型到系统性实但业界一直未有研究证实。底懂近日,不懂字节跳动豆包大模型团队公布最新论文,物理完成研究历时8个月,字节围绕“视频生成模型距离世界模型有多远”首次在业界完成系统性实验并给出明确结论:视频生成模型可以记忆训练案例,验证但暂时还无法真正理解物理规律,模明做到“举一反三”。型到系统性实
图灵奖得主、底懂Meta首席AI科学家杨立昆点赞并转发了该研究,不懂表示“结论不令人意外,物理完成但很高兴终于有人做了这个尝试!字节”
自OpenAI发布Sora模型以来,验证很多视频生成模型都会强调其生成结果对物理规律的模明遵循。豆包大模型视觉团队相关小组,对视频生成模型究竟能否从视觉数据中“发现”并“理解”物理定律感到好奇,决定深入研究。
历时8个月,该团队完成了业界首个系统性的实验研究。团队通过专门开发的物理引擎合成了匀速直接运动、小球碰撞、抛物线运动等经典物理场景的运动视频,用于训练基于主流DiT架构的视频生成模型。然后,通过检验模型后续生成的视频在运动和碰撞方面是否符合力学定律,判断模型是否真正理解了物理规律,并具有“世界模型”的潜力。
实验中设计的不同运动场景
豆包大模型团队的实验发现,即使遵循“Scaling Law”增大模型参数规模和数据量,模型依然无法抽象出一般物理规则,做到真正“理解”。
以最简单的匀速直线运动为例,当模型学习了不同速度下小球保持匀速直线运动的训练数据后,给定初始几帧,要求模型生成小球在训练集速度区间内匀速直线运动的视频,随着模型参数和训练数据量的增加,生成的视频逐渐更符合物理规律。
然而,当要求模型生成未曾见过的速度区间(即超出训练数据范围)的运动视频时,模型突然不再遵循物理规律,并且无论如何增加模型参数或训练数据,生成的结果都没有显著改进。这表明,视频生成模型无法真正理解物理规律,也无法将这些规律泛化应用到全新的场景中。
通过进一步的实验分析,研究团队得出结论,“生成新视频时,模型主要依赖对训练案例的记忆和匹配。视频生成模型就像一个只会‘抄作业’的学生,一旦遇到从未见过的场景,如不同大小、速度的物体相互作用,就会‘犯迷糊’,生成结果与物理规则不符。”
不过,研究中也有一个好消息:如果训练视频中所有概念和物体都是模型已熟悉的,此时加大训练视频的复杂度,比如组合增加物体间的物理交互,通过加大训练数据,模型对物理规律的遵循将越来越好。这一结果可为视频生成模型继续提升表现提供启发。
据了解,本研究两位核心一作都非常年轻,一位是95后,一位是00后,在豆包大模型团队专注视觉领域的基础研究工作。作者们一直对世界模型感兴趣,在8个月的探索中,他们阅读了大量物理学研究文献,也尝试从游戏中获得研发灵感,历经多次失败后,最终一步步确定研究思路和实验方法。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
4
-
浏览
48
-
获赞
1729
热门推荐
-
阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿
潮牌汇 / 潮流资讯 / 阿迪达斯 Superstar 女生专属蛇纹鞋款系列开售,华丽野性范儿2020年02月17日浏览:3454 为迎接贝壳头诞生 50 周年,从去年修改考核制度,让公交车不再急刹车
11月19日《京华时报》同一天刊发两则北京公交车急刹车导致乘客受到伤害的消息。一则是,丰台区一698路公交车停靠洋桥西站,乘客上车后刚刚启动便来了个紧急刹车,乘客摔倒一片,共有6人被送医,所幸都为皮外中石化"香艳照门"中的"手段之恶"
12月4日,网友“阿里席学刚”上传了一组40余张的“香艳照片”。爆料称,照片为中石化河南石油公司物流中心处长赖某和其部门一已婚年轻女下属张某于2012年10月左右借休年假之机所拍。5日凌晨,网贴所传赖耗资2800万的“停摆”车站建给谁看
广东揭阳市岐山汽车站2001年动工建设,2004年建成,耗资2800万元,至今未能投入使用。目前,该站只有一名总经理在正常上班,据其介绍,该汽车站位置偏僻,站场前后的道路狭窄,大型客运车辆掉头都有困难10月家电线下市场:彩电零售额规模同比上涨82.1%
10月彩电线下零售额规模同比上涨82.1%;均价为7909元,同比上涨23.9%。11月16号消息,奥维云网最新公布了10月家电市场总结。根据数据来看,10月彩电线下零售额规模同比上涨82.1%;均价读懂“缺编30多万体育老师”的潜台词
昨日,教育部体卫艺司司长王登峰表示,义务教育阶段教师整体超编一百多万,但体育教师缺编三十多万,他认为在未来相当长的时间内还做不到配齐体育老师,体育老师的问题非常严峻。12月2日《新京报》)流水不腐,户清华博士的选择警示“塑模”式教育
近日,清华博士生萧杨突然放弃留校继续做科研的机会,与北京一所重点中学签约做数学老师。其导师写下3000多字的长信,表达惋惜与困惑。数日后,萧杨在一个社交网站上贴出一封长信回复老师,“我已经厌恶科研了。调查报告:中国停产或半停产企业占比创3年新高
中新社北京11月17日电(记者 周锐)中国企业家调查系统17日在北京发布“2012?中国企业经营者问卷跟踪调查报告”称,受产销、订货下滑,库存压力加大以及产品价格下跌等因素影响李铁:尊重和重视每一个对手 长期封闭对球员非常残酷
李铁:尊重和重视每一个对手 长期封闭对球员非常残酷_比赛www.ty42.com 日期:2021-10-06 23:31:00| 评论(已有305679条评论)中学宿舍门反装猫眼中的价值排序
近日,温州市龙湾区实验中学被曝在学生寝室门上反装猫眼,在寝室外通过猫眼可以看清室内情况,而从里面看不到外面。学校称这是为了更好地管理学生,方便教师观察学生就寝后的动态。学生则认为此举侵犯了隐私权。11驾警车为女出头恐非“激情犯错”
11月18日,《庐江“威武”警察夫妇,真的有辱身上警服》一帖在网上引热议。原来,16日22时20分左右,安徽庐江县庐江中学一女生乘坐该县6路公交回家,因公交多开了一截路而生气,不愿下车,并打电话将其乘唐代的仕女们会举办哪两种野宴活动?史书又是怎么记载的?
探春宴与裙幄宴是唐代开元至天宝年间仕女们经常举办的两种野宴活动。“探春宴”的参加者多是官宦及富豪之家的年轻妇女。下面趣历史小编就为大家带来详细的介绍,一起来看看吧!据《开元天宝遗事》记载,该宴在每年农stefanoricci官网(stauff官网)
stefanoricci官网(stauff官网)来源:时尚服装网阅读:25069stfearicci是什么牌子Stefano Ricci(史蒂芬劳.尼治)是一个世界顶级男装品牌,被喻为“领带之王”。S交警车内开罚单,被淋湿的是公权形象
交警车内开罚单让车主淋雨等候,称怕罚单湿。微博上一组交警路边执法的图片引起争议。一位交警正在警车内开罚单,车主在窗外等着。车主是位裙装女子,右手盖着头顶,目视着车内开罚单的交警。此时,天空正下着雨。事清华博士生“弃研从教”有何可惜的
近日,清华博士生萧杨突然放弃留校继续做科研的机会,与北京一所重点中学签约做数学老师。其导师写下3000多字的长信,表达惋惜与困惑。数日后,萧杨在一个社交网站上贴出一封长信回复老师,“我已经厌恶科研了。