cbr文件格式(作为一个音乐发烧友,这些主流音频格式你都知道多少?)

音乐爱好者对声源文件有很高的要求,这在n年前很流行mp3音乐早已不能满足时代的需要,所以有各种高分辨率的声源格式,下面逐一介绍。

1.首先要介绍的是近年来流行的直接流数字。

应该指出的是,DSD不是一种格式,而是可以理解为一种“打包”音频文件的方式。

DSD可以翻译为“直接比特流数字”,这是索尼和飞利浦在1996年宣布的一项高分辨率数字音频规范。DSD的新技术与DVD的音频技术指针竞争,以1位比特流采样,高采样率2.4MHz(64倍CD44.1KHz采样),以脉冲模式直接将模拟音乐信号的波形转换为数字信号,并将音乐存储在近四倍CD的空间中,所以它可以提供更好的音效。由于采样次数较多,采样波形非常圆滑,与原始模拟波形比较接近。此外,由于不使用多比特,因此省略比特转换程序,这减少了由于数字滤波可能产生的失真和噪声。此外,由于它不像多位系统那样容易受到电源或外部干扰的影响(位越高,越容易),因此在理论上质量相对稳定。

近年来,各大音响制造商一直在大力炒作DSD的设备,说DSD有多好。

但很少有人知道DSD是什么!即使是传统的PCM,有些人也不知道它是什么。

要明确的是,DSD无法绕开PCM。

PCM(脉冲编码调制)是最常见的一种音频编码格式,什么wav,ape,flac,MP3等等,几乎所有常见的音频都是PCM编码格式。

PCM是指每个采样点测量一个绝对值,并且采样点彼此独立。

对于CD中使用的16位44.1kHzPCM,要求每秒采样44100个信号,然后使用一组65536值(即16位,2的16次方)数量为了测量采样电平,在如此高的采样频率和16位指定电平的精度下,记录的信号与原始信号非常接近(至少大多数人的耳朵无法分辨)。

我们还可以通过提高采样率和指定级别(如24位、88.2khz、96KHz和192Khz)的精度来更好地记录原始信号

然而,PCM仍然有一个瓶颈。量化噪声在所有频带中均匀分布。即使精度和采样率继续大幅提高,也很难减少更多的噪声。

原理很简单。首先,我们准备了一组指定的电平值(对于电平的概念,它可以简单地理解为电压),例如-3、-2、-1,0,1,2,3等。每个值都有一个数字,就像ABCD一样,但现在我们对这些电平值使用二进制数(即000、001、010等)

好吧,开始转换过程。模拟信号来自麦克风。我们每隔几分钟对该信号进行一次采样,以获得其采样水平,然后从上一组指定的水平中找到最接近采样水平的值,嗯,四舍五入,然后记录最接近的值的数量,然后以这种方式进行下一次采样,一组二进制数(即数字信号)可用于记录来自麦克风的原始模拟信号,记录的数字信号为PCM

上面的整个过程通常被称为ADC编码过程,基本上就是录音室中的录制过程。

当引入PCM时,据说对于16位PCM,每个记录的采样点都需要16位数据

但是,对于每个采样点,DSD可以用1位进行记录,即仅用“0”表示“否”,用“1”表示“是”来记录该采样点的电平值。

这似乎和外星技术一样不可思议,但事实上,原理并不复杂,只需要一些基本的数学知识就可以理解。

在DSD的编码过程中,信号的量化方式与PCM完全不同。

为了全面改进脉冲编码调制数字音频技术,获得更好的音质,满足流行高保真播放设备的需求,我们需要新技术来取代它,所以我们有DSD。

首先,Δ调制的概念

想象一下,与其使用一组指定的级别值作为PCM,我们只使用一个固定值“Δ”来测量原始信号。它仍然是在每个固定的时间段进行采样。每次采样获得的电平将与上次采样的信号进行比较。如果其插值大于Δ,如果插值小于Δ或是负数,则输出“1”,然后输出“0”因此,每个采样点可以以1位的形式记录。

Δ调制的缺点是,随着输入模拟信号频率的增加,信噪比会急剧降低。我们可以降低Δ,提高采样率来控制量化噪声

cbr文件

DSD的主要思想是这样的。每次采样的值是前一次采样的相对值,前后采样点彼此紧密相连。由于其连续性,这种定量方法的思想更接近声音的本质。

为了克服Δ,调制的缺陷发展为∑-Δ调制器(西格玛-德尔塔调制器)

如上图所示,如果我们在信号的输入端添加一个微分器,信号从微分器的正相位输入,然后通过积分器,然后到Δ调制器(a/D)Δ,调制结果进行D/a转换,延迟作为反馈输入到微分的反相端,这是一个完整的∑-Δ,调制器消失。

整体的定量方式与Δ的思维方式相同,调制方式相似,但反馈给微分器反相输入的电平是整个信号的最大值或最小值(即Δ,如果调制输出为1,它将反馈给Vmax,如果输出为0,它将反馈给Vmin,两者都是固定值),也就是说,积分器将输入电平和最高/低电平之间的差值进行积分,然后我们将再次分析积分结果Δ调制(这个过程可能不太容易计算。将原始信号作为函数f(x)的导数,然后我们进行f(x)Δ调制量化,这可能更容易理解)。

以这种方式,量化对象成为当前信号电平与所有先前差值之和之间的差值。量化电平将不再受频率的影响,最大量化范围直接取决于电平值。

反馈中增加的延迟电路使∑-Δ调制器具有噪声整形特性,一阶∑-Δ调制器的噪声整形效果不明显,但我们可以将多阶∑-Δ调制器叠加在一起,使噪声整形效果达到比高水平更高的水平。这种噪声整形的具体结果是,量化噪声的总体积没有变化,但并非均匀分布在所有频带中。低频段的量化噪声较少,高频段的量化噪声较多。换句话说,在音频应用中,量化噪声被“推”到高频段,大多数量化噪声被推到远超过20kHz的高频段,即人耳听不到的频带。这些噪声可以通过使用低通滤波器轻松消除。

这是DSD相对于PCM的最大优势,量化噪声最小,信噪比超高。

DSD对调制得到的数字信号通过了上述∑-Δ,如果将这一系列数字信号放在同一刻度上,与原始信号相比,会发现数字“0”和“1”会随着信号电频率的增加或减少而相应变化。因此,DSD也称为脉冲密度调制。

DSD的基本原则大概是这样的。对大多数人来说,这可能有点难理解,但Δ调制部分应该是每个人都能理解的。

事实上,只要你理解Δ,就足以把调制的概念推广到DSD身上。对于非专业人士来说,没有必要如此深刻地理解。普通人了解DSD的主要特征就足够了。

2.AAC格式

弗劳恩霍夫杜比实验室、美国电话电报公司;T.由索尼和其他公司联合开发,目的是取代MP3格式。

与MP3不同,它使用新的算法编码效率更高,具有更高的“性价比”。使用AAC格式,人们可以感觉到声音质量更小,而不会显著降低AAC标记。

较小的文件大小可以获得更高的音质;它可以提供多达48个全方位频道;高达96KHz采样频率;解码和播放占用的资源更少。

3.苹果无损格式

(AppleLosslessAudioCodec,alac)是苹果的无损音频压缩编码格式,它可以将未压缩的音频格式(WAV,AIFF)压缩到原始容量的40%到60%左右,编码和解码速度非常快。此外,由于它是无损压缩,因此听起来与原始文件完全相同,并且不会因解压缩和压缩而更改。

alac和MP3的主要区别在于,在编码过程中,MP3会取消一小部分高频和低频音频数据,而alac会如实记录,不会删除音频中的任何详细数据。由于数据是无损的,alac音频文件的大小将大于MP3。通常,每个音乐CD(大约70到80分钟)经过alac编码后,音频文件的大小约为300MB。

4.AIFF格式

一种音频格式,用于在个人计算机和其他电子音频设备中存储音频数据。这种格式是苹果在1988年基于exchange文件格式(IFF,广泛用于Amiga系统)开发的,主要用于苹果的OSX操作系统。

标准AIFF文件中的音频是线性PCM(脉冲编码调制)。还有一种被称为aiff-c或AIFC的压缩变体,具有变量定义的压缩代码。

标准的AIFF格式,连同SDII和WAV,被认为是专业注册视频和音频编辑应用程序的领先格式,与众所周知的有损格式MP3相比,它没有被压缩。与其他未压缩的无损音频格式相比,AIFF将比MP3占用更多的磁盘空间。停留立体声在44.1kHz采样率和16位采样深度的条件下,这种差异约为10MB/min。除了音频数据,AIFF还可以包括循环点数据和样本的音符,供硬件采样器和音乐应用程序使用。

标准AIFF文件的扩展名为AIFF或aif。压缩AIFF文件的扩展名应为AIFC,但AIFF和aif也被支持AIFF的应用程序广泛接受。

5.索尼自己的格式

ATRAC3/ATRAC3plus

ATRAC3(自适应转换声学编码3)由日本索尼公司开发,是MD采用的ATRAC的升级版本。其压缩率(约为ATRAC的两倍)和音质相当于MP3。压缩原理包括同步掩蔽、老化掩蔽和等响度曲线,与MP3大致相同。ATRAC3的版权保护功能采用OpenMG。目前,与ATRAC3相对应的便携式播放器主要是索尼自己的产品。然而,在2000年2月,该公司和富士通、日立、NEC、Rohm、三洋和Ti等半导体制造商已签署专利许可协议,为ATRAC3制造和销售LSI。与MP3相比,ATRAC3在MDLP压缩下录制CD时仍有一些声音优势,但版权问题使其使用不便。ATRAC3plus凭借其先进的算法进一步改善了音质,但它仅在索尼的产品中广泛使用。这令人不安。Atarc是索尼MD使用的标准压缩格式

说到索尼,我们必须提到:Hi高分辨率音频。

Hires是Hi的缩写。这是索尼在2014年提出的最新高质量音乐标准。除了保持数字音频的典型优势,例如便携性和易用性。它的音质性能远远超过了现有的压缩音频格式和CD。音频格式的规格可以高达192Khz/24位或更高的分辨率,即采样率高于44.1KHz,位深度大于16位。

对于CD音频,它以每秒44100次的速度对声波进行采样;Hires高分辨率音频的采样频率为每秒96000次,甚至192000次。这样的采样频率可以让Hiresaudio获得更丰富的详细记录和更宽的声音频率范围。

例如,如果CD有16位,这意味着可以分析65536个音阶,而24位声音将能够分析16777216个不同的音阶。采样频率越高,位深度越大,这意味着声音的描述和恢复更准确。

目前,主流的数字音频技术是以PCM模式对模拟声源进行数字化,也可以称为脉冲编码调制。无论是未压缩的线性PCM格式文件WAV、AIFF,还是无损音频压缩编码FLAC或alac,您都会经常看到以“96/24PCM”打包和下载的高分辨率音乐。

另一种数字化模拟声源的方法称为DSD(直接数字流),它以单比特值序列捕获声音信号,采样率非常高,高达2.8MHz或5.6mhz。这大约是CD音频采样率的64或128倍,即DSD2.8MHz或DSD5.6mhz。对于一些工程师来说,这是数字采样文件接近原始模拟声源的极限。

此外,Hires音频的来源采用了四种主流高质量录制类别:mq-p(来自PCM数字主频段,规格不低于48kHz/20位)、mq-a(模拟主频段)、mq-c(频率从44.1kHz/16位CD规格上升)、mq-d(DSD主频段)。

6.Mp3音频格式

MP3格式诞生于20世纪80年代的德国。所谓MP3是指MPEG标准的音频部分,即MPEG音频层。需要注意的是,MPEG音频文件的压缩是一种有损压缩。MPEG3音频编码具有10:1~12:1的高压缩率,同时基本上保持低频部分不失真,但牺牲了声音文件中12khz至16KHz高音频的质量,以换取文件的大小。对于长度相同的音乐文件,请使用*MP3格式,通常仅使用*Wav文件,因此音质不如CD格式或WAV格式。

MP3格式的压缩音乐有很多采样频率。您可以使用64Kbps或更低的采样频率来节省空间,也可以使用320kbps标准来实现非常高的音质。早期的MP3编码采用固定编码速率(CBR)的方法。128kbps意味着它是以128kbps的固定数据速率编码的——你可以提高这个编码速率,最高可达320kbps,音质会更好,当然,文件的音量也会相应增加。

由于MP3的编码方法是开放的,因此可以在此标准框架的基础上选择不同的声学原理进行压缩处理。因此,兴公司很快推出了可变编码率压缩方法(VBR)。它的原理是以高比特率对歌曲的复杂部分进行编码,以低比特率对歌曲的简单部分进行编码。这样,我们就可以进一步实现质量和数量的统一。当然,早期Xing编码器的VBR算法非常差,音质也远低于CBR(固定比特率)。然而,该算法指出了一个方向,其他开发人员也推出了自己的VBR算法,这使得效果不断提高。目前,人们已经认识到lame是一个好的开端。它完美地实现了VBR算法,是完全自由的软件,由爱好者组成的开发团队一直在不断开发和改进。在VBR的基础上,lame开发了ABR算法。ABR(averagebitrate)是VBR的一个插值参数。Lame为CBR文件的低体积比和VBR生成的文件的可变大小创建了这种编码模式。ABR将每50帧(30帧约1秒)作为指定文件大小内的一个部分。相对较低的流量用于低频和不敏感频率,而高流量用于高频和大动态性能。它可以作为VBR和CBR之间的折衷方案。

7.APE无损音频编码格式

APE是流行的数字音乐无损压缩格式之一。与MP3等有损压缩格式不同的是,APE的无损压缩格式以更精确的录制方式减少了音量。MP3不可逆地删除数据(对人耳听觉不敏感)。恢复的数据与源文件相同,以确保文件的完整性。APE软件猴子'S的音频被抑制。开发商是马修·T·阿什兰。源代码是开放的。它以界面上的“猴子”标志而闻名。与类似文件格式的FLAC相比,ape具有检查错误的能力,但不提供纠错功能,以确保文件的无损和纯净;另一个特点是压缩率约为55%,高于FLAC。体积约为原始CD的一半,便于存储。

简而言之,APE压缩类似于winzip或WinRAR等专业数据压缩软件的压缩原理,只是APE等数字音乐经过无损压缩后的音频文件可以直接播放。APE的压缩率是动态的。在压缩过程中,只有可压缩部分会被压缩,不能压缩的部分仍会保留。

monkey音频的压缩效果约为2:1,这意味着压缩结果是原始大小的一半。CD的存储空间约为680mb。由monkey的音频压缩的文件需要大约330MB。相比之下,它仍然占据了更多的空间。

8.FLAC无损音频编码格式

FLAC不同于MP3。MP3是音频压缩编码,而FLAC是无损压缩,即音频经过FLAC编码压缩后不会丢失任何信息。将FLAC文件恢复为WAV文件后,内容与压缩前WAV文件相同。这种压缩方法与zip类似,但FLAC的压缩比大于zip和RAR,因为FLAC是专门为PCM音频特性设计的压缩方法。

无损压缩:编码音频(PCM)数据没有信息丢失,解码后的输出音频与编码器输入的每个字节相同。每个数据帧都有一个当前帧的16位CRC校验码,用于监控数据传输错误。对于整个音频数据段,原始未压缩音频数据的MD5也保存在文件头中,用于在解码和测试期间验证数据。播放WAV文件时,计算机将WAV文件中的PCM数据直接发送到声卡。播放FLAC时,计算机需要将FLAC解码为PCM数据,然后将其发送到声卡。还有一个额外的解码链接,就像解压缩RAR文档一样。它的PCM数据与压缩前的WAV没有什么不同。

抗损坏:由于FLAC的帧结构,一旦数据流损坏,损失将限于损坏的数据帧。一般来说,只有很短的片段会丢失。当许多其他无损音频压缩格式遇到损坏时,一个损坏将导致所有后续数据的丢失。

9.APE与FLAC的区别

简要总结:

压缩算法是不同的。ape是双精度浮点数字算法,FLAC是整数数字算法。一般来说,ape的压缩量较小,但每种算法都有不同的压缩级别。压缩级别越高,卷越小,解压缩过程中占用的系统资源越多。一些高压缩ape和一些FLAC球员不能上场。此外,FLAC是开源的,所以普通玩家更支持FLAC。如果声源丢失,ape有一个脉冲,FLAC没有脉冲。回放过程是解码成标准wav,并将其发送到I2C总线。至于具体的区别,它们是非常微妙和形而上学的。实际上,它们主要是由漂移误差引起的。

在音质方面,如果机器没有问题,播放效果与未压缩的wav没有区别。然而,由于播放过程中需要额外的解压缩步骤,一些爱好者认为这一过程也会影响音质,导致音质损失。

10.APE与FLAC的详细比较

压缩比所有无损压缩码的压缩比都比较相似,但在这些无损压缩码中,APE的压缩比更好,FLAC的压缩比略低。以一个49784kb的“5FLAC星墓-与死者同床.Wav”为例,转换为FLAC后大小为3706KB,转换为ape后大小为36460kb。两者的压缩率分别为74.33%和73.24%。在大多数情况下,从压缩的WAV音频文件获得的APE文件通常比压缩的FLAC文件稍小。由于不同WAV文件中的信息量不同,以上数据仅供参考。

2、编码速度

FLAC的压缩和解码速度明显优于APE。只有在fast的编码强度下,APE才能与FLAC竞争。但与之相对应的是,APE的压缩率一直高于FLAC,APE在快速压缩下获得的文件量与FLAC在最高压缩比下获得的文件量相当(经测试,大小为49784kb的“五星墓穴——与死者同床共枕.Wav”在最高压缩比级别8下,通过快速压缩和FLAC获得的文件分别为36854kb和36960kb)。换句话说,如果以速度为基准,在相同的压缩速度设置下,两者的压缩比是相同的。

3、平台支持决定人气

与APE相比,FLAC的解码复杂度较低(解码运算量小,只需整数运算),解码速度快,对计算硬件的要求很低。在非常普通的硬件上很容易实现实时解码和回放。FLAC是唯一一个得到硬件广泛支持的无损压缩编码。在消费领域,许多移动多媒体播放器、汽车和家庭音频设备都支持FLAC格式。APE格式。目前,该官员只提供赢家支持。虽然曾讨论过为GNU/Linux和Macintosh平台提供官方支持,但没有结果。目前,只有一个名为Supermx的开发者在2003年7月发布了一个非官方的移植版本。它包括XMMS和beepmediaplayer的插件,用于播放monkey的音频。最初,迁移只支持GNU/Linux,但从版本3.99update4build4开始,它支持基于PowerPC和SPARC平台的MacOSX和GNU/Linux。然而,这项非官方的移植计划尚未得到官方认可,由于官方发放许可证的限制,其未来也不确定。然而,据说在wine的帮助下,猴子音频的Win32库可以在GNU/Linux平台上运行。在硬件支持方面,由于采用浮点运算,编解码速度慢,对硬件要求高,硬件支持不如FLAC。

4、两者的开源特性

APE是个人作品,未来不排除版权问题;技术水平和支持不如FLAC的国际标准格式。FLAC是一种开源的、完全免费的无损音频编码和压缩格式。这是一个国际标准。这种与CD质量相同的音乐格式在音质上无可挑剔。以FLAC的方式压缩不会丢失PCM音频的任何信息。你永远不必担心卷入版权诉讼。得益于此,许多音频处理软件可以默认输入和输出FLAC格式的文件,这为音频的后处理带来了方便。两者的开源或部分开源为音频软硬件的设计提供了极大的便利。目前,不仅几乎所有主流播放软件都支持这两种功能,而且很多播放器在硬件上也支持FLAC和APE。正是因为APE解码的计算量太大,并不是每个APE文件都能被硬件播放器顺利播放,这也会消耗更多的电量。

5、容错性

APE文件的容错性较差。只要在传输过程中有一点错误,整个APE音乐就会失效。FLAC文件的每一帧数据之间没有相关性。因此,当FLAC的文件在传输过程中被破坏,导致一帧数据的损坏和丢失时,它只会丢失该帧的音频信息,不会影响前后的数据。这是FLAC的优势,也是FLAC的压缩率略低。

11.WAV格式

WAV为微软开发的一种声音文件格式,符合riff(资源交换文件格式)文件规范,得到WIN平台及其应用程序的广泛支持。该格式还支持msadpcm、CCITTalaw等多种压缩算法,并支持多种音频号码、采样频率和通道,WAV文件的标准格式与CD格式相同。它也是一个44.1k的采样频率和一个16位的量化数字。

WAV通常使用三个参数来表示声音、量化位、采样频率和采样点振幅。量化比特分为8比特、16比特和24比特。声道可分为单声道和立体声。单声道的振幅数据为n*1个矩阵点,立体声为n*2个矩阵点。采样频率通常为11025Hz(11khz)、22050hz(22khz)和44100HZ(44KHz)。然而,虽然音质很好,但压缩文件的音量太大了!与其他音频格式相比,它是一个缺点。文件大小的计算如下:WAV格式文件的容量(b)=(采样频率x量化位x通道)x时间/8(字节=8bit)。WAV格式音频文件的大小为每分钟10MB,其大小不随音量和清晰度的变化而变化。

WAV对音频流的编码没有严格的规定。除了PCM,几乎所有支持ACM规范的代码都可以对WAV的音频流进行编码。

您可以还会对下面的文章感兴趣

最新评论

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

使用微信扫描二维码后

点击右上角发送给好友