让我们想象一下这样的场景:您被12个颂钵包围着,周围充满了响亮的声音和闪烁的谐波,复杂的泛音充斥在您身边的各个角落。尽管您此时正完全被包裹在这些声音当中,但是您仍然可以精确的定位出声音在空间中的精确位置。随着这个演示的结束,您平静下来,才发现您实际上并没有被12个颂钵所包围,而是正身处于音乐圈最大的贸易展会当中。
上面我所描述的场景就是2019年的NAMM展中,Genelec的沉浸式体验展台上所展示的场景。Richard Devine是一位电子乐音乐家,同时他也是一位声音设计师,他受邀在7.1.4 Dolby Atmos扬声器系统(该系统使用了七个定向扬声器,一个重低音音箱和四个顶置扬声器)上展示他制作的一些三维声/环境立体声录音。凭借Genelec所提供的拥有最先进技术的扬声器,再配合杜比的声学规格,该展台能够把听众包裹在一个完全立体的声音“半球”中。
Devine在回忆起这段经历时,饶有兴致地说:“当时在场的每一位观众,甚至包括我自己,都非常的震惊。我们所有人都吃惊的坐在那里,震惊的下巴都掉下来了。您能够听到从头顶传来的声音,从侧面传来的声音,从各个方向传来的声音,我们完全沉浸在这些声音当中......是一种身临其境的感觉。就像是您正身处于那个房间里,被这些颂钵所包围着。”
在过去的几年里,Devine一直身处在(不断发展着的)沉浸式音频领域的前沿,旨在创造出能够令人信服的三维声音体验。例如,站台上所使用的颂钵的录音就是最近他与Rode Microphones(Soundfield Ambisonic麦克风的发明人)一起创作的。这位模块化合成器的爱好者也被谷歌,苹果和微软等科技业的巨头聘用,为它们的虚拟现实应用以及其他的一些绝密项目提供3D音景和音乐。
Brian Eno的三维声/环境立体声扬声器系统。
仅凭着Devine的这些经历,我们就能够清晰的意识到沉浸式音频的确是音频技术的未来,但这也引出了另一个问题:为什么至今为止都没有一个真正的沉浸式音乐技术面世?除了一些例外 - 比如于20世纪70年代出现,随即就迅速被抛弃的四声道立体声格式,还有Brian Eno推出的3扬声器家庭立体声hack系统(在Ambient 4:On Land的专辑内页中有详细的描述) - 我们的音乐从未真正的超越立体声时代。环绕立体声专辑仅仅存在于一个很小的市场中,但总体来说,老式普通的立体声系统那无法撼动的地位,已经保持了有50多年了。
然而,随着沉浸式音频的发展,这一现象有可能会被改变。事实上,这种改变很可能已经发生了。您有感觉到吗?
我相信无论音频技术的未来到底如何,人们对沉浸式音频技术都是充满好奇的。接下来我会为大家介绍下沉浸式音频的基础知识、它是如何运作的、它能为音乐人和创作者们带来的怎样惊人的可能性以及(如果您想进一步探索沉浸式音频的话)您所需要使用到的一些工具和资源。
什么是沉浸式音频?
如今的时代,无论是在哪里,媒体都变得越来越具有沉浸感。VR头戴式设备变得越来越便宜,每个月都有为VR设备开发的新游戏和新应用程序出现在应用市场上。使用了杜比全景声(Dolby Atmos)技术的3D大制作电影在任何一个大牌剧院都可以看得到。声音是上面所有这些体验的核心部分,因此沉浸式音频技术的发展也异常迅速。(沉浸式音频和“空间音频”通常可以互换使用,但是它们之间还是存在差异的。您可以参阅文章结尾处的术语表来了解。)但是,究竟什么是沉浸式音频,它与环绕立体声之间又有什么不同之处?
沉浸式音频技术超越了环绕式立体声技术 - 事实上,从字面上(它们的名字上)来看,我们也能发现它们之间的差别。即使在最昂贵的9.1声道系统中,传统的环绕立体声技术也只能作用于听众周围的水平面,是一个二维的概念,仅仅相当于沉浸式音频所能覆盖的球体的一个截面。像Dolby Atmos和DTS:X这样的沉浸式音频技术通过在天花板内布置扬声器,创造出了高度这个新的维度,从而将声场扩展为三维。
另一个主要区别是沉浸式音频技术的实现是与扬声器无关的,这意味着人们只需要对混音进行简单的调整,就可以在不同的音响系统上进行回放。然而环绕立体声技术需要为不同的音响系统(例如5.1,7.1等等)准备单独的混音才可以。对于沉浸式音频技术来说,我们不但可以在电影院的音响系统中使用,也可以在智能扬声器网络,甚至是普通的耳机上回放同一段混音,而且能够同时保留住空间信息。
有趣的是,沉浸式音频技术并不是一个全新的技术。三维声/环境立体声是如今主流的沉浸式音频技术之一,但是它早在20世纪70年代就已经被人们发明出来了。
双耳声也是一个在这几年逐渐流行起来的概念,但是在这之前它其实已经存在了很长一段时间了(还记得Virtual Barbershop虚拟理发店吗?)。最初双耳声这个词是作为立体声录音的同义词使用的,真正的双耳声音频会使用特殊的录音和播放技术来重现声音,以便让我们的两个耳朵自然地接收到声音信号 - 这也就人们使用“双耳声”这个词的原因。
纵览音乐发展的历史,其中充满了人们对沉浸式录音和沉浸式回放系统各种野心勃勃尝试,无论是那些身穿实验室大褂的工程师们,还是具有前瞻性眼光的音乐家们都曾参与其中。
双耳声
虽然沉浸式音频的概念和技术已经不是什么新鲜的玩意儿了,但最近该领域却迎来了爆炸式的发展,这其中最主要的一个推动因素是:娱乐产业。现如今,像VR和杜比全景声(Dolby Atmos)这样的技术已经发展成熟,因此沉浸式音频技术的那令人兴奋不已的市场终于被打开了。您现在可以在剧院体验到沉浸式音频技术,甚至是使用iPad和耳机(观看同一部电影)也能够获得几乎相同的体验。
艾比路(Abbey Road)是一个庄严而神圣的音乐工作室,披头士乐队,乔治·马丁(George Martin),杰夫·埃里克(Geoff Emerick)以及其他一些推动了录音技术发展的伟大音乐人们都曾经在这里工作过。现在,艾比路凭借着旗下的Abbey Road Spatial Audio Forum,成为了沉浸式音频领域的领导者之一。该工作室由其音频产品的负责人Mirek Stiles创立,他在工作室主持研究工作,经常召集音频工程师和音乐家们一起进行实验和头脑风暴,并且将这些颇有价值的沉浸式音频的资料都发布在了其网站上。
对于沉浸式音频这种70年代就起源的技术,为什么能够在如今发展到了一个崭新的阶段?Abbey Road Spatial Audio Forum对这个问题做了如下的解释:“沉浸式音频技术真正的突破点是人们在玩游戏时更多的开始使用耳机,因此针对耳机的相关技术得到了广泛的重视和开发。如今随着虚拟现实设备的发展,沉浸式音频的技术拥有了更多的应用场景。其中的理由非常简单:当您与3D图像进行交互时,声音也应该让您感受到空间感,只有这样才能真真正正的体会身临其境的感觉。”
如果现在我们就可以通过耳机来获得完整的360°的声音体验,那么这项技术被更广泛的应用到整个音乐圈的日子还会远么?
音乐的可能性
电影产业和游戏产业一直都是引领音频技术革命的排头兵,因此那些为这些产业创作音乐的专业作曲家就最有可能是将沉浸式音频推上音频新标准宝座的首功之臣。声音在自由度上的增强不仅有助于作曲家们在创作时的情感表达,还能够让配乐为动作和对话腾出更多的空间。如果您是一位专业作曲家,或者您的梦想是成为专业作曲家,那您就不能忽视沉浸式音频技术。
在上面的这个3D弦乐四重奏的表演中,您能够通过角度的调整来感受整个大厅中的声音。
另一方面,对于其他的音乐家来说,360°的全景音乐视频是沉浸式音频最常见的应用场景。随着360°全景摄像头以及三维声/环境立体声麦克风的价格变得越来越亲民,艺术家们能够以前所未有的方式将听众们带入到他们的表演当中 - 无论是在街头的表演,在现场的演出,还是在录音棚中制作的录音。
对于音频工程师和音乐制作人来说,沉浸式音频技术一定是它们非常渴望了解的技术 - 毕竟,那些具有前瞻思维的作曲家和音乐人在制作音乐时,还是需要有专业人员来帮助他们进行编辑和调音。三维声/环境立体声麦克风是一个如瑞士军刀般“万能”的利器,它不仅可以用于制作精美的沉浸式音频,还能够带来全包裹式的声场,可以被当成是“虚拟麦克风”,聚焦在房间中的任何地方。
即使是DJ们,也可以享受到沉浸式音频所带来的乐趣。像London"s Ministry of Sound这样的夜店正在安装杜比全景声(Dolby Atmos)音响系统,以便为俱乐部的客人们提供身临其境的音乐体验。杜比甚至开发了一个应用程序,通过它,DJ和电子乐音乐家们能够实时的对声场进行操纵,始终将人群包围在音乐当中。
在杜比推广该平台的一个宣传视频当中,英国的DJ Yousef这样说:“当您聆听沉浸式音频时,您会感觉自己仿佛就处在音轨和唱片当中。”也是在这个视频当中,身兼音乐制作人和DJ的 Deadmau5说到:“我认为这将是我以后所使用的最主要的技术。我会在Atmos中进行编曲,然后再混音时转换成立体声。”
Loben Quartet - Vivaldi"s Winter,在360°的环境立体声中的表现
那些喜欢新事物的音乐人会非常喜欢沉浸式音频 – 拥有催眠般效果的现场表演和极具突破性的音频设备会变得层出不穷。
作曲家斯蒂芬巴顿(Stephen Barton)曾经为《泰坦陨落》,《使命召唤:现代战争》等游戏制作配乐。他同样被沉浸式音频所带来的无限的可能性所吸引。在接受艾比路的Mirek Stiles采访时,他说到:“革命这个词在音乐圈中经常被提起,但是通常都是名不副实 - 但是这次 (沉浸式音频技术)确实是来真的了。如果沉浸式音频的制作质量足够优秀,我们会有一种完全突破了空间和设备的限制,从而完全身临其境的感觉 - 这种效果非常震撼。”
Devine同样用充满激情的话语为我们解释了这种效果:“至少对于我来说,在我的脑海里,音乐就像是变成了一栋建筑。我能够想象出音乐在我的脑海中变成了Frank Gehry的建筑作品,拥有弯曲的金属和玻璃装饰,肋骨状的建筑结构仿佛在我的身边展开。如果音乐在每个方向都是多维的,围绕在您的身边,在您的头顶之上,在您的身体下方,您可以在这些音乐的细节中体验到它的存在。这种效果绝对是非常惊人的。“
沉浸式音频所需的工具
那么如何真正的实现沉浸式音频呢?首先,您其实不需要使用昂贵且复杂的多声道扬声器系统来获得完整的沉浸式音频效果。只要您的耳机是双声道/双耳声“解码”的,您就可以通过它来体验沉浸式音频带来的效果。双耳声解码模拟了我们的耳朵识别空间信息时的独特方式,因此我们可以使用任何支持该技术的耳机来体验360°沉浸式音频(为了获得最好的体验,建议您使用耳罩式耳机)。
虽然在这个过程中需要使用特殊的软件来对沉浸式音频进行混音,但是很多这类软件都是免费的,而且使用起来非常容易。如果您是新手,我推荐您从空间音频的插件开始入门,比如Ambisonic Tool Kit(ATK),AmbiX,Rode的Soundfield,或者是Facebook的FB360 Spatial Workstation,上面所有这些工具/插件都可以免费下载,学习起来也不难。
上面所说的这些软件包中包括了将单声道或立体声信号源转换成三维声/环境立体声格式的编码器插件,还有能够在3D空间中对声音进行移动和定位的工具,以及能够将同一段混音应用在不同的回放系统上时所需要使用的解码器插件。Spatial Workstation中还包含了能够用于处理360°视频和VR内容的工具,它能够完整的跟踪我们头部的运动。
如果您想从源头开始录制沉浸式音频的话,那么您需要一个三维声麦克风,这种麦克风能够将完整的3D空间声音记录在四个声道上。Zoom的H3-VR standalone recorder是一款相当超值的入门级设备,而价格相对较高的Rode Soundfield NT-FS1和Sennheiser Ambeo VR则拥有更加丰富和高级的功能。使用三维声麦克风,您可以捕捉几乎所有场景中的声音,并带能够收录到令人难以置信的逼真细节。
Zoom H3-VR
Sennheiser Ambeo VR 3D
声音的未来
只有时间才能证明沉浸式音频是否能够真正的引领音乐圈的潮流,但是如果它在娱乐界和科技领域的发展顺利,那么它所带来的革命也许会很快到来。虽然对于家庭用户来说,复杂的扬声器阵列不是个很好的解决方案,但是通过耳机来体验沉浸式音频会是一个重要的突破口。无论未来会发生什么,至少有一件事是肯定的 - 我们需要有创造力的人来推动音频技术的进步。
如果您就是这个人,碰巧正在阅读这篇文章,那我鼓励您大胆的前进,带领我们进入一个全新的声音世界。
沉浸式音频技术的术语表
空间音频,本质上来说它是对沉浸式音频的一种更加科学的表达方式。通常来说,这两个名称可以互换使用,但是空间音频是一个相对更准确的术语。
在三维声/环境立体声中,声音可以被定位在以听众为球心的球体中的任何一个位置,通过在四个声道上进行编码 - 三个通道分别用于前/后,左/右和上/下的方向信息,还有一个“全向”通道。在回放环境立体声时,必须解码后才能在特定的回放系统上进行播放,这个系统可以是DTS:X家庭影院系统,也可以是传统的5.1声道环绕设备,甚至可以是常规的耳机。
三维声/环境立体声麦克风使用了四个以正四面体方式排列的麦克风头,它能够捕捉一个球形空间内的完整声音,并保留声音的精确空间位置。使用三维声/环境立体声进行录音时,采用raw四声道,A-format进行录制,之后必须转换为空间化的B-format,以便进行进一步的混音。这被称为一阶环境立体声。
高阶环境立体声是指一系列的更为复杂的环境立体声格式,它通过使用更多的通道来实现更准确的空间定位。如果您将一阶环境立体声麦克风看成三个双向麦克风所组成的一个“大头钉”形状的麦克风团儿,那么二阶和三阶的环境立体声麦克风看起来会更像是一个团儿,但是会有更多的突出节点。
基于对象的音频是另一种空间音频格式,其工作方式与环境立体声完全不同。从技术上来说,环境立体声格式仍然是基于通道的,但是基于对象的音频会把每一个声音视为可以在虚拟空间中进行移动的对象。
杜比全景声(Dolby Atmos)是由电影技术巨头杜比实验室(Dolby Laboratories)开发的专利技术,是一种基于对象的音频格式和平台。Atmos实际上是一个连接着各种系统的网络,其中包括了特殊的混音软件,电影院的扬声器阵列规格,甚至包括了用于家庭的沉浸式音频硬件,比如配备了Atmos技术的AV接收器和条形音箱。
DTS:X是杜比的竞争对手DTS所开发的另一种基于对象的音频技术。它的工作方式与杜比全景声基本相同,而且所实现的效果也差不多,但是DTS:X使用了不同的工具。好消息是,很多支持杜比全景声的设备也支持解码DTS:X格式。
头部相关传递函数(HRTF)是一个描述您的头部和耳朵对您所感知的声音的影响的科学参数。来自不同方向的声音分别到达两只耳朵时,会具有轻微的相位和频率上的差异,这个差异能够让我们本能地定位到声源。在沉浸式音频中,人工的HRTF可以被用来将复杂的空间混音转换为左右两个声道的声音信号,从而在耳机中产生逼真的双耳声/身历声效果。
来自米饭星