AI可以修复声画,也能修复回忆吗?
作者丨何思思
编辑丨林觉民
有一种情怀叫Beyond,黄家驹一开口,画也谁的可修DNA动了?
7月3日19点,“Beyond Live 1991生命接触演唱会精选及纪念音乐会精选超清修复版”在抖音、复声复西瓜视频、画也今日头条等多个平台重映。可修时隔31年,复声复Beyond再次走进了大众视野。画也
一句“今天只有残留的可修躯壳 迎接光辉岁月 风雨中抱紧自由”瞬间将人们拉回了1991年9月Beyond在中国香港红磡体育馆举行的“Beyond Live 1991 生命接触演唱会”,那场演唱会也成了Beyond播放率最高的复声复一场演唱会。
此次修复版演唱会,画也从《光辉岁月》、可修《海阔天空》再到《不再犹豫》...一首首经典歌曲,复声复吸引了1.4亿人次的画也在线观看。活动结束时,不少人在评论区纷纷刷起“没有看够,再回放一次,在哪可以下载高清版视频”等留言,致敬经典,致敬Beyond。
除了满满的情怀和回忆外,在这场演唱中可以感受到,无论是画面清晰度、色彩饱和度、还是音质降噪等方面都极大地还原了线下演唱会观看的效果,火山引擎就参与了这场演唱会的修复工作,在其算法的加持下,为观众呈现了一场具有情怀的视听盛宴。
对于抖音和火山引擎来说,其使命不在于修复一场演唱会,提升画面清晰度和辨识度这么简单,而是通过修复唤起几代人背后的回忆,从而产生共鸣擦出火花,这才是修复的价值所在。
时隔31年,年轻的Beyond 回来了
在各大短视频平台经常刷到修复版影片的重映,这也成了人们致敬经典的最佳途径之一,这背后往往需要AI技术的加持。
AI修复影片早已不是一件新鲜事,随着技术的更新迭代,近段时间AI修复演唱会成了新风口。从修复类型来看,虽然二者都属于视频修复的范畴,但却着较大的差别。
火山引擎音频技术团队研究员舒晓峰表示,影视和演唱会的内容和制作方式有较大的差别,其中演唱会是以唱歌的形式输出,现场环境较影片环境复杂,不仅有环境声还有歌声,另外拾音设备也存在一定距离,这就导致演唱会修复要比影视片修复复杂得多。
值得注意的是,画面通常是演唱会修复的重要环节之一,因为它决定了整体演唱会的观感。
火山引擎多媒体实验室研究员赵世杰告诉雷峰网,演唱会的画质修复并非大家想象的那么简单,以Beyond Live 1991 生命接触演唱会为例,由于当时演唱会整体环境较暗,细节不够丰富,场景切换快,灯光以及声音环境复杂等给修复工作带来了严峻的挑战,从而给算法增加了难度。
赵世杰介绍,早期录像设备的解析度比较差,拍摄的画面分辨率低且清晰度差,往往会造成画面模糊、纹理缺失等问题;压缩存储方面,早期影片隔行扫描的方式造成了交错条纹的瑕疵问题,对画面的美观性和完整性都有较大的影响。
另外,色彩、亮度也是修复的一大难点,由于早期拍摄设备的原因,影片存在大量的过曝和死黑场景以及较重的底噪,在亮度调解过程中如何避免底噪被放大,以及如何降低过躁造成的不适感是算法的难点。
其实在画质修复环节,最难的是人脸,这也是观众最在意的点。演唱会中人脸往往会出现多个角度,比如正脸、侧脸、俯视、仰视等,甚至有被乐器遮挡的人脸,如何调节不同景别,不同姿态下人像修复效果且跟背景不同,这就对算法提出了严峻考验。
面对这些问题,赵世杰向雷峰网阐述了火山引擎增强算法的应对之道:
清晰度修复方面,基于在大量数据上训练的深度学习算法,火山引擎通过清晰度增强和瑕疵修复法的能力将视频分辨率从低清处理变为超高清,并在缺少纹理的区域生成更丰富的细节。
同时对于隔行扫描的视频画面,火山引擎多媒体实验室设计了多帧输入的神经网络去交错法。
赵世杰特别强调道,这主要在于早期视频大多采用隔行扫描的方式进行处理、编码、显示,会造成现代设备直接播放过程中产生严重的闪烁现象。这主要是因为隔行扫描讯号,两行只有一行有影像,另外一行全是黑的,所以都需要经过去交错处理,将隔行扫描讯号转换为逐行扫描讯号。
在这种情况下,传统去交错方式一般输入仅做单交错帧,对时域上的内容变化感知较弱,因此对于运动场景的拉丝情况处理较差。
与传统去交错方式相比,火山引擎设计的多帧输入神经网络去交错法就实现了传统交错法无法达到的技术效果,凭借其泛化性的特点,修复了Beyond演唱会中更多的细节和运动场景下产生的拉丝情况。
通过前后对比效果可以看出,在乐手的手部原本有横纹拉丝的问题,并且画面较为模糊,经修复后,无论是琴还是人的手部画面都完美还原了现场的真实感和清晰度。
亮度、色彩修复方面,针对Beyond演唱会中存在的老旧视频褪色、颜色异常、过曝、过暗等问题,火山引擎采用了基于美学评分的自适应分区域色彩亮度增强算法。
该算法主要以具体片源效果作为基础,依据美学评分,在色彩、亮度、对比度、饱和度、人像ROI和背景方面做分区域增强,并根据不同帧的色彩统计信息进行自适应亮度增强,使亮区与暗区都能得到最好的表现效果,还使修复老旧视频的褪色和保留老旧视频的复古感,两者之间达到了平衡。
人脸修复方面,演唱会很多片段中的人脸存在较大的彩色噪声,压缩损伤等问题。另外据了解目前业界大部分的人脸修复只是基于单张照片,很难找到基于视频的人脸修复,因为视频中每一帧中脸的角度不一样,各种姿态下的脸都需要算法处理。
火山引擎重点突破,基于深度学习模型,在Beyond演唱会修复中采用自适应人像增强算法进行修复,通过先验特性,在消除人脸模糊和压缩损伤的同时还可以对五官进行重建,甚至可以对发丝等细节和纹理进行重建和添加,做到不同景别、不同姿态下的人脸修复工作,使人脸更为清晰。
从整体演唱会的主观感受上看,修复后的画面更清晰、更真实。
有用户在评论区留言,修复后的演唱会有一种现场观影的即视感,歌手乐手的脸部以及乐器舞台等细节,清晰可见,有一种置身Beyond Live 1991生命接触演唱会的感觉。
时隔31年重现,Beyond歌声不减“现场”
大多数人认为,高清的音质能提升整个演唱会的完整度和精致度,也会极大增加观众的观感。
对于Beyond这类能触发人情怀的经典演唱会更是如此,修复的好可能热评如潮,修复不好可能就是一场悲剧。
在Beyond这场演唱会修复过程中,音质同样给修复带来了不同程度的困难挑战。
舒晓峰向雷峰网介绍了音质修复的难点:
其一,由于录音设备和环境的噪音导致音质差,加上周边环境会录制到一些底噪声;
其二,设备压缩算法等导致截止效率低带来的带宽不足问题;
其三,混响过大导致音质差以及响度问题带来听觉不适等问题。
为此,火山引擎音视频技术团队做了针对性研究,并给出了相应的解决方案。
首先,面对噪音干扰问题,舒晓峰表示,目前业界大多采用传统降噪方式,但其特点主要适用于人声,音乐被降噪算法处理后会受到不同程度的损伤,而演唱会是一个人声、音乐声,现场环境声等交杂的声音环境,显然传统降噪方式不适用于演唱会的音质修复。
考虑到这点,火山引擎研发了针对这种多元素场景的音频降噪算法,与传统降噪方案不同的是,该算法兼容了音乐场景和人声场景,可以在保留人说话声、音乐声的前提下,抑制其他噪声。
其次,带宽也是影响演唱会音质的关键要素。舒晓峰告诉雷峰网(公众号:雷峰网),演唱会中由于拾音设备、录制硬件或者压缩等原因,会使高频信息受到损伤,影响听觉体验感。基于此,火山引擎通过音频超分算法,对人声部分进行了频带拓展,在不伤害音质的前提下丰富高频信息,使声音从闷变得更清亮。
从频谱图中可以看到,通过超分模块的处理,原始音频的高频部分得到了拓展和增强。
再者,演唱会往往伴有不同的乐器声,观众欢呼声以及现场各种忽大忽小的声音,火山引擎通过响度算法单独提取唱歌部分,然后进行调整,最后混合,使得人声和其他声音的音量配比更加舒适,从而提升观众的听觉感受。
值得注意的是,此次修复演唱会是由1991 生命接触的演唱会和纪念音乐会音乐会两部分组成。舒晓峰表示,这极大增加了修复难度,为了避免两部分音量不同,对两场演唱会的拼接部分做了响度调整,此外也对前后两部分不同歌手的音量大小做了响度调整,极大提升了听觉体验。
通过Beyond演唱会的重映,许多观影者都给予了高度评价,不少人表示,不仅画面清晰,音质方面也体验到了线下听演唱会般的听感。
老旧视频修复,Beyond之后又是谁?
AI修复视频,已经成了近两年许多厂商感兴趣且愿意花费时间精力去做的有意义的事情,其也逐渐成为了诸多平台新的增长极。
视频修复方面,其实火山引擎早在去年就有了动作。去年10月,西瓜视频就联合火山引擎推出了“经典视频4K修复计划”。不到一年的时间,已经通过AI 技术手段完成了百部经典动画片的修复,其中包括71部影片的4K修复,童年记忆《葫芦兄弟》的播放次数达到300万。
火山引擎能完成如此高质量的修复任务,主要是在视频云方面的技术积累和成功实践。同时抖音、西瓜视频、今日头条等不同场景还为其提供了试验田。
据介绍,火山引擎视频云通过技术的积累,可以为用户的四大体验负责,包括互动、播放、画质、性能四方面的体验感。在优秀的用户体验的加持下,火山引擎的音视频技术已经渗透到了游戏、电商、教育以及金融等行业。
老旧视频的修复才刚刚开始,从经典动画片到演唱会,再到更多的经典影像修复,仍需要通过不断的技术迭代来实现。
友链
外链
互链
Copyright © 2023 Powered by
六合彩图库源码【购买联系电报bc3979】AC彩票网站源码|六合彩源码|彩票搭建|新中原六合彩源码|【网站bc9797.com】六合彩论坛源码【联系飞机bc3979】
sitemap
-
文章
2
-
浏览
3827
-
获赞
7
热门推荐
-
中粮集团旗下各上市公司2019年3月11日-3月15日收盘情况
3月11日3月12日3月13日3月14日3月15日中粮控股香港)06062.802.842.812.802.73中国食品香港)05063.163.173.093.053.07中粮包装香港)09063.成吉思汗后宫有多少女人?他最爱的是谁?
成吉思汗戎马一生,在征服了一个个部落、城邦的同时,他也俘获了众多美女的芳心,说是俘获芳心,还不如说是强抢芳心,一代最强大脑成吉思汗,你知道他的女人是如何来的吗?成吉思汗的后宫有五百女人,大部分都是征服西南空管局林涛总工一行赴贵州空管分局开展企业化改革专题调研
根据西南空管局党委“不忘初心、牢记使命”主题教育安排,西南空管局总工程师林涛、相关职能部门和企业到贵州空管分局分局开展企业改革主题调研。8月2日-3日,调研组在分局召开了座谈会,贵州空管分局张平局长、民航西北空管局技保中心无线电监测车载设备更新项目进入实施阶段
8月5日,民航西北空管局技保中心设备监控室将无线电监测车送往成都厂家进行车载设备升级改造。5日6:30,设备监控室、现场车队三位同志为了避开早高峰的车辆拥堵选择一大早出发,路上途径宁陕、汉中、绵阳等地真维斯官网旗舰店(真维斯官网旗舰店电话)
真维斯官网旗舰店(真维斯官网旗舰店电话)来源:时尚服装网阅读:2002淘宝网上的真维斯官方旗舰店与真维斯时尚旗舰店有什么区别!是。淘宝的官方店是正品。因为对于淘宝的官方店来说。旗舰店是要自己的品牌,一中国航油山西分公司太原航空加油站多措并举积极协调保供油道路畅通
近日,中国航油山西分公司太原航空加油站接到机场有关部门通知,由于边防检查站门口修路封闭22小时道路,将影响加油车进场。在得知消息后加油站值班经理立即向山西分公司汇报情况,并根据机场方面提供的绕行路线进珠海空管站管制运行部开展2019年度法定自查
为落实民航上级要求,检验法定自查工作制度及程序的有效性,确保管制运行部各项工作符合法律法规、行业标准及规范性文件的要求,经过前期周密的准备,珠海空管站管制运行部于8月5日开始启动部门2019年度法定自貂蝉之美,乱世中独树一帜的女性枭雄之姿
能够居于中国古代四大美女之鼎,享有“沉鱼落雁之容,闭月羞花之貌”的美誉之貂蝉。虽然史册上没有记载,盛传于民间的传说关于貂蝉的花容月貌或许亦有些夸张,但细细想想总也不会逊色。貂蝉之美,美在于出生之地。貂波帅:内维尔批评蓝军是因为不想利物浦赢 总拿10亿镑说事不公平
2月28日讯 在联赛杯决赛不敌利物浦后,内维尔称切尔西为“一群亿万英镑的软蛋”。近日,切尔西主帅波切蒂诺在谈到此事时说道:“我和他的关系很好,但这不意味着他能说一些不公平的话。在我看来,这句评论是不公东航北京凌燕乘务示范组机上开展“缘在七夕”特色活动
“女士们,先生们,每年农历七月初七是七夕节,又名乞巧节。七夕始于汉朝,是中国传统文化节日。后被赋予牛郎织女的传说使其成为象征爱情的节日。在这个特别的日子里,我们邀您共同分享我们传统的民间节日,祝您七夕练就精兵,打造服务先锋 ——记物流分公司国内业务部云中之鹰班组长董山山
文/刘婧、秦静)核心人物:董山山董山山,广州白云国际机场航空物流服务分公司出港文件室云中之鹰班组班组长,2008年进入机场,她从基层业务员做起,至今已经在职11年,她从一名懵懂的女孩,成长为可以独挡一24架航班躲避台风“利奇马” 民航江西空管分局顺利保障
连日来,超强台风“利奇马”呼啸而来,自 8月9日起,受台风“利奇马”影响,上海两场、江浙地区多个机场部分时段航班无法起降。民航江西空管分局精心部署,顺利保障24架因躲避台风“利奇马”来昌的备降航班。从为国产GPU崛起努力!摩尔线程今起正式启动A股上市进程
快科技11月13日消息,据国内媒体报道称,今天起摩尔线程正式办理上市辅导备案登记。国内GPU独角兽摩尔线程今日在北京证监局办理上市辅导备案登记,正式启动A股上市进程,辅导机构为中信证券。之前,摩尔线程西北空管局通信室完成主用应急内话停机工作
中国民用航空网通讯员王丹报道:为积极响应运管委工作,充分确保运管委与管制间通信畅通。8月4日凌晨,西北空管局技保中心通信室对内话设备进行停机工作。本次停机应管制需求,新增一路塔台管制室至运管委的直通电大连空管站飞行服务室圆满完成CNMS系统换新及升级工作
8月初,大连飞行服务室在北京数据公司的帮助下进行了航行情报CNMS系统的换新和升级安装工作,航行情报系统主用服务器、备用服务器全部更换新设备,配备两套全新工作站,并将CNMS系统版本更新至3.6.3。