News
行业新闻

揭秘数字音频(中)

2020年04月13日音频处理浏览量:0

揭秘数字音频(中)

“苹果数字母带技术标准”的概念

“苹果数字母带技术标准”(Apple Digital Masters)的前身为“iTunes母带技术标准”(MFiT,Mastered for iTunes),指的是苹果公司自主开发的一套技术规范,旨在让混音师制作出最适合平台的高品质音频流媒体,以供消费者在Apple Music订阅或在iTunes Music Store购买。近期,苹果宣布iTunes Music Store会发生一些改变,但毋须担心,因为iTunes Music Store并不会消失,而是被内嵌于新的Apple Music APP中,而视频内容则将转移至Apple TV APP里。这就意味着我们提供给苹果公司的母带音频将被转化为苹果独有的AAC格式,该格式可以很好地保留音频的原始动态范围,甚至有比CD音质的红皮书标准(16-Bit、44.1kHz)精度更高。

苹果公司使用的AAC音频格式全称为“高级音频编码”(Advanced Audio Coding),用于对数字音频进行压缩和编码。AAC格式与MP3格式类似,但提供了比MP3格式更好的编码算法,可以在生成相似大小的编码文件条件下,保持更好的音质。2003年,当iTunes Store首次推出时,苹果公司使用的是128kbps(千位每秒,指的是数字信号的传输率,下文会详细介绍)的AAC格式文件。随着技术发展,iTunes版本升级为iTunes Plus,开始使用256kbps(VBR,“动态比特率”,下文会详细介绍)的AAC编码格式。

关于AAC格式与MP3格式的说明

上文提过的术语kbps,其英文全称是“Kilobits Per Second”(千位每秒),它指的是MP3格式或AAC格式文件的数据传输率,因此也代表对音频文件数据压缩的大小。一个未压缩的16-bit、44.1kHz、.wav格式(又称为线性PCM格式)的音频文件数据传输率为每分钟1.4MB(Megabytes,兆字节),因此一首3分钟的歌曲要占用大约30MB的数据量(计算公式:数据量(字节)=时长(s)*声道数量*比特深度(bit)*采样率(Hz)/8)。对于同一首歌来说,如果使用标准的256kbps AAC格式压缩,则只需要占用1/5(大约6MB)的数据体积量。MP3格式常用的“比特率”(Bit Rate)包括128kbps、192kbps、256kbps和320kbps,AAC格式则针对256kbps进行了优化。

VBR(Variable Bit Rate)则是指“可变比特率”。不同于CBR(Constant Bit Rate,“恒定比特率”),可变比特率是一种在不牺牲音质的前提下创建小容量文件的有效方式,VBR文件的比特率会随着歌曲输入信号的变化而变化,已达到所需的数据量。例如,当音频信息非常简单时,可以使用较低的比特率,而当音乐十分复杂时,就可以使用更高的比特率。AAC格式使用的是一种被称为“平均比特率”(Average Bit Rate)的VBR编码。

一般来说,256kbps的AAC格式音频的听感和更高数据传输率(320kbps)的MP3格式音频相同,甚至更好。AAC格式的音频文件还能支持多通道音频格式,具有比MP3格式更宽广的“频率响应”(Frequency Response)和优秀的“瞬态响应”(Transient Response,指的是系统在某一典型信号输入作用下,其系统输出量从初始状态到稳定状态的变化过程)。

采样率

音频文件的采样率可以决定所录音频的频率响应。如果我们希望复现该音频至少到达20kHz的频率,而采样率必须在该频率的2倍以上,也就是说,我们需要使用至少44.1kHz的采样率。苹果公司的最新编码方式使用了“采样率转换”(SRC,Sample Rate Conversion)方法,不论您提交的母带文件的原始采样率是多少,都统一将您.wav格式的母带音频文件重新采样为44.1kHz。苹果公司使用这种算法十分精妙,可以令音频文件在44.1kHz的重采样下获得绝佳的听感。

比特深度

比特深度决定了一段音频信号的动态范围。每1-bit代表大约6dB的动态范围。最常见的音频比特深度设置有两种:16-bit(CD品质,可提供96dB动态范围)与24-bit(数字音频工作站文件标准,可提供144dB动态范围)。不论音频文件的比特深度是多少,在“数字音频工作站”(DAW,Digital Audio Workstation)中设置32-bit浮点运算已经十分普遍。在不讨论24-bit整数运算与32-bit浮点运算各自优劣的前提下,我们可以放心地说,32-bit浮点运算本身为计算机内部的音频处理提供了更精确(更好听)的解决方案。当今市场上的音频接口和模数转换器为我们在数字音频工作站中的工作提供了16-bit或24-bit的比特深度,但它们内部运算也可以以32-bit浮点进行运算,以提供更高的声音分辨率。当您从32-bit浮点运算设置的数字音频工作站工程中导出24-bit的最终版母带文件时,请确保在加入了抖动处理。许多数字音频工作站都能以32-bit浮点运算输出母带,但请您确保发行商或终端用户可以接受此规格的音频文件。

符合“苹果数字母带技术标准”的采样率和比特深度

苹果公司为了制作出具有最佳听感的流媒体音频文件,使用了“两步处理法”(Two-Step Process)来处理制作人提交的音频母带文件。根据苹果公司的规定,首先,音频文件会在32-bit浮点精度运算下转换采样率,然后,将文件编码至AAC格式。这样的处理方式可以有效防止“削波”(Clipping,一种音频失真形式)效果的产生,并同时保留了原始音频的动态范围。除此之外,该处理方式还避免了额外向您的母带文件中加入的抖动处理。

为了使您的音乐在被编码为AAC格式文件时最大程度地保留原始效果,苹果公司创建了一个文档,概述了将音频文件传送给苹果公司的最佳方法。这些方法来自一群值得信赖的、并且获得“苹果数字母带技术标准”认证的母带工程师和音乐供应商们。不仅如此,苹果公司也一直依赖这套认证系统来完善并执行这些规范。以下是“苹果数字母带技术标准”中,一些关于交付音频技术指标的建议:

·提交高解析度的母带,最理想的规格为24-bit比特深度、96kHz采样率。在您的制作过程中,请尽量使用最高的音频解析度。不过,对音频进行升采样率处理并不会为它增加更多信息,也并不会提升整体音质。也就是说,如果您的原始母带处理格式设置为24-bit比特深度、44.1kHz采样率,保持该设置即可,不用再做升采样至96kHz的处理。

·不惜一切确保您的音频不要削波失真,保证有足够的“动态余量”(HeadRoom)。虽然苹果公司不会拒绝接收有几处削波的音频文件,但人耳可听的失真效果并不符合“苹果数字母带技术标准”。苹果公司建议您,在制作最终版的.wav格式的母带处理时,以0dBFS为上限值,为音频向下余留1dB的动态余量。这个操作十分简单,您可以在使用数字“限制器”(Limiter)时,确认在“真实电平峰值”(True Peak)模式下或打开“采样间电平峰值”(ISP,Inter-Sample Peaks)选项后,将“上限值”(Ceiling)设置为-1.0dB。

·在您的听众可能使用的播放设备上检查母带效果。您需要在制作时兼顾考虑这些播放设备的局限性,以及听众的收听环境。有许多软件工具可以帮助您将母带转化为AAC格式文件进行监听,例如“Ozone 8”的“Codec Preview”功能、“Sonnox”公司的“Codec Toolbox”工具,等等。

母带处理工具

为了帮助您检验自己的音轨是否符合“苹果数字母带技术标准”,苹果公司开放了一些用来验证母带完整性的实用工具的访问权限。

“Master for iTunes Droplet”,一个独立的、拖放操作的工具,用于将原始格式为AIFF和WAV的母带音频编码为苹果公司标准的AAC格式音频文件。如果您的.wav格式文件采样率高于44.1kHz,则会使用苹果公司优化后的“采样率转换”(SRC,Sample Rate Conversion)算法进行降采样至44.1kHz。另外,如果您熟悉在Mac OS系统上使用终端运行的方法的话,就可以直接使用命令行用例“Afconvert”,手动创建AAC格式的音频文件了。您可以在《苹果数字母带技术标准指南》(Apple Digital Masters document)中找到这些命令行代码的示例。

为了帮助您检验自己的音轨是否符合“苹果数字母带技术标准”,苹果公司开放了他们用来验证母带完整性的实用工具的访问权限。

另一个命令行“Afclip”,它可以帮助您检查音频文件中的削波情况。其工作原理是,“Afclip”会生成一个特殊的立体声音频文件,该音频文件的左声道使用原始音频,右声道使用图形表示音频当中每段削波处的采样,这样,您就可以快速确定音频发生削波失真的时间点和位置。它还会对每段削波采样生成文本读数,并对这段音频文件中的削波采样进行计数统计。

“AURoundTripAAC”,一个“AU”(Audio Unit)格式的插件,可以帮助您快速地进行A/B比对原始音频与使用iTunes Plus的AAC编码后的音频。该插件可以在许多音频应用程序中使用,例如“Logic”或者“AU Lab”。

“Audio to WAVE Droplet”,一个独立的转格式工具。它可以将Mac OS X原生支持的任何音频文件格式转换为.wav格式,还可以像命令行“Afconvert”一样,将AAC格式的音频文件解码为24-bit的.wav格式音频文件,并允许您一次性解码多个文件。

面向未来的母带制作之道

母带制作行业对母带工程师的交付作品要求日益增高,随着与日俱进的技术发展和新型音频格式的引入,母带工程师必须不断学习并适应新的行业标准。早在CD音质作为标准音频格式的时候,混音工程师仅需提交16-bit、44.1kHz的音频文件。如今,每个发行商或分销商都有一套自己的数据音频文件提交技术标准。

母带工程师通常认为的最佳做法是,向客户提供多个文件。虽然16-bit、44.1kHz的标准对CD刻录来说是最佳设置,但这并不是一个具有高解析度的音频格式,对于文件格式转换和流媒体压缩(例如AAC或MP3)来说不是最佳方案。除了向您的客户提供正确加入了抖动处理的16-bit比特深度的文件,您还应该额外提供高解析度的、符合“苹果数字母带技术标准”的音频文件,以满足您的作品在高解析度的音频回放系统中、或者在以有损格式编码的发行版本中,也有理想的表现。

“苹果数字母带技术标准”的认证徽章

苹果公司的“数字母带技术标准”是一套最佳实践准则。如前所述,我们采用了一套荣誉认证系统以确保制作与交付的都是最优质的母带作品。苹果公司会向其内容开发商提供认证过“苹果数字母带技术标准”的供应商名单,不过,其实任何理解并遵守苹果公司指导规范的机构单位,都能制作出符合“苹果数字母带技术标准”的作品。但是,如果您希望自己的音乐在iTunes Store上显示“苹果数字母带技术标准”的认证徽章的话,就会比较复杂了。主流唱片公司发行的唱片几乎全部都会显示这个徽章,但如果您是在“Tunecore”、“Distrokid”或类似的数字音乐分销商平台上发布自己的音乐,就必须提前做好功课,看这些平台是如何处理您的音频文件,并且他们是否具备认证“苹果数字母带技术标准”的资质。以“Distrokid”为例,该平台需要您主动向他们发送电子邮件,提供上传音频文件的具体说明,才能获得“苹果数字母带技术标准”认证徽章。

发行最高品质的音乐,是我们共同的追求。随着编码技术的进步和流媒体带宽的增加,用户可以体验到越来越好的声音效果。只要我们始终遵循最佳实践准则(例如“苹果数字母带技术标准”),我们的母带音频文件就能成为最好听的声音作品!

Chapter1 第一章

关键要点

• 采样率决定了音频的有效频率响应范围。

• 较高的采样率可能适合更精美的音乐。

• 在视频项目中坚持使用48kHz的音频采样率。

• 比特深度决定了音频的有效动态范围。

• 使用24-bit或更高的比特深度进行录音、混音、母带制作

• 在输出16-bit的母带时加入抖动处理

• “苹果数字母带技术标准”为制作“高解析度”(HD,High Definition)音频母带制作提供了最佳实践准则

• 保持音频的动态表现和动态余量,以达到发行版本的最佳听感

“每个人都是敏锐的,没有灵感加持,人类是无法创作出与大多数人有共鸣的音乐的。”

——A.R.Rahman

“Everybody around is so good, so to create music that will connect with so many people is not humanly possible without inspiration.”

——A.R.Rahman