SOUND SYNTHESIS 音频后期

人声的混缩处理

发布于:2018-09-07 10:31:43 作者:点击:3746

人声


一、音频的定义

声音是发音体的振动通过空气传播的一种连续的波,人耳通过感受空气的震动听到声音,频率在20~20khz之间,低于这个频率范围的声音称为“次声波”,高于这个频率范围的声音称为 “超声波”。最简单的声波形式是正弦波。声音不是一个单音,而是一个复合音。也就是由声音的基音和一系列的泛音所构成。这些泛音都是基音频率的倍数,它对音色的特性有非常重要的影响。这些泛音的数量和泛音幅度的不同构成音色的频率特性曲线。这条曲线就体现了音色的表现力。例如,钢琴的最低音频率是27Hz,最高音频率是4100Hz,钢琴的泛音高频可达10kHx-20kHz,男声基音频率在64-523Hz左右,泛音可扩展到7-9KHz,女声基音频率在160Hz-1.2KHz左右,泛音可扩展到9-10KHz。这些泛音可分为低频泛音、中频泛音和高频泛音。如果低频泛音的幅度较强,音色就表现得混厚;中频泛音的幅度比较强,音色就表现得圆润、自然、和谐;高频泛音的幅度比较强,音色就表现得明亮、清透、解析力强。


二、声音频率特性(频谱仪)

任何声音可以分解为数个甚至无限个基础正弦波(基音),它又包含有无数多的谐振波成分(即泛音)。而且时刻都在变化着。所以一个声音的构成其实是很复杂的。将声音的频率分量绘制成曲线,在图形绘制和频率的测量中,通常以倍频程(后一个频率均为前一个频率的两倍)或更细的1/3倍频程,如以倍频程的中心频率31.5、63、125、250、500、1K、2K、4K、8K、16KHz 这十个频率为横坐标,纵坐标为分量值(音量值),就形成了频谱。测量和描述声音频率特性的图形显示仪器, 谓之“声音频谱仪”。由这个频谱仪可以直观看出声音各频点的声音分量值(声的大小,即振幅大小),一般专业录音软件都有软频谱仪,根据各频点的音量可分声音的动态范围(最大音和最小音的距离)。


三、Leading Vocal的处理指南

处理过程中要添加的效果顺序是:规格化(波形相位归零)→降噪(采样降噪或噪音门降噪)→压限(分频点压限或全频段压限)→均衡(一般是四频点均衡、各频点音频调整要视各声部的音域而定)→声场拉宽→混响→局部的细节处理。处理完成后,进行试听和调整,感觉满意后,在多轨编辑状态下进行成品混缩。压制成其他各种格式的音频文件,混缩成品时,要注意:人声一定要自然、默契的融入到伴奏音乐中,不能给人孤立和脱节的感觉, 可以通过适当添加混响、同时扩展人声和伴奏的立体声声场等。


(一)、规格化和音量调整

规格化就是将声音波形的相位归零,在保证不出现削波失真的前提下, 将音量调整到最大。


(二)、降噪

消除背景噪音(环境噪音、设备噪音,降低或消除设备噪音、环境噪音、喷音、爆音等,录人声时,经常会出现喷音和气声,尤其是歌词中有“不”、“扑”、 “去”、“思”等字时,可以用均衡进行处理滤掉无用的杂音,衰减它们的音量,录音前先录些环境音,用采样降噪法降噪、此外还可以使用噪音门降噪。


(三) 压缩:

对人声音轨进行动态处理,施加少量压缩------ RATIO:2:1 / Threshold:-10DB / Attack time & Release time,根据音乐风格和节奏类型设置。

轻柔的人声使用过度压缩─RATIO 6:1至10:1,可增加“空气感”和加强动态。

Ultrafunkfx CompressorR3里的一参数参考:作用阙值:-12.0db、比率:6:1、增益:12db、触发时间:2.5ms、释放时间:500ms、限制器:开、自缓冲:开(其他的不变)


压缩器调节理论


录制得到的人声音轨总是感觉不到位,显得太软,始终得不到足够的冲击力。我们可以利用压缩控制该轨道的动态,压缩也是限制的意思,音量越大越容易爆,把压缩比率加大限制声音的过载自然就提高了动态。这样做的目的是得到丰满而有冲击力的音色。

通俗点说就是:把过高的部分降下来,过低的部分升上去,使人声更均匀。

缺陷:通常,音轨的动态受到控制后,声音会因动态的收缩而产生张力,但同时高频也会随之损失,声音会显得呆滞、黯淡。所以接下来应用均衡器,在被削减的高频段范围作提升调节。补偿高频的足够音量。


参数设置建议和解析:


1. Threshold门阀值参数通常都被设置为-5dB与-20dB之间。具体数值要取决于录音时的电平和它的动态范围。

2. 如果要得到较丰满和大动态的音色,可以加大压缩的比率值,就是Ratio。量值通常被设置在2:1与8:1之间,一般要避免出现超过10:1这情况。因为过压缩(OverCompressing)只会导致声音干涩且毫无生气。(这点切记!)

3. Release释放时间一般可设定为150ms(毫秒),如果在声音的段落间听到因压缩器产生的静噪,可以适当提升Release,或是再提升一点Threshold门阀值。

4.Attack触发时间一般设为10ms(毫秒),如果发现有些声音变得“口齿不清”,没有自然的棱角,演唱者演唱的清晰度也受到了影响时,则可以提升attack触发时间,或适当衰减Ratio。

5.如果你的压缩器具有硬拐点和软拐点选择(HardKnee选项),即是可选Soft/Hard档,则选Soft。使用软拐点的话,当信号超过阀值后,压缩处理是逐渐产生作用的,压缩不会让声音变化显得过分剧烈,这一点在比率参数值比较大时非常明显。

P.S.---压缩器的使用很大程度决定于你的经验和听力,以上方法并不是绝对的!还是要根据现实情况来决定参数的设置的。

另外在Compress(压缩)器后面加放DE-ESSER(嘶声消除器)消除齿擦音。或靠均衡来消减高频齿音也可。


(四)、均衡


提升或衰减某些频段的音量。因为我们录入的某段音频,是由很多频率段组成(基音的频率段,和泛音的频率段), 由于人发声的方法不同,高音很容易“噪”(就是齿音很明显)或声音过亮,会有爆音现象,低频容易“浑”,感觉吐词含糊不清此外,还由于电脑中常用电容式话筒的中高频拾音率或灵敏度高,高频很容易“噪”,下面是常用的频点调整范围:


1、男声的音色频率调节


男声基音频率在64-523Hz左右,泛音可扩展到7-9KHz。

(1)对64-100Hz做小的提升,可以增加一些浑厚感,这一段频点也是男低音的音域;

(2)100Hz以下频率切除,可以消除低频噪声,使音色更加纯净;

(3)男声音域比女声低一个8度音程,频率低一个倍频,在100Hz衰减了3dB左右,可以增加清晰度。

(4)在250-330Hz做大的提升,可增加基音的力度和饱满程度,声音的响度也会增强,因为男声基音的主要频率在这个区域。(如果声音浑浊,要衰减250hz附近的频段。250hz左右的频段范围决定声音饱满或浑浊。)

(5)在500-800Hz要小量衰减,使音色不要太生硬。(如果声音听起来有喇叭音,请衰减500hz附近的频段。)

(6)对1KHz左右频段做小的提升,这样可保证泛音的频率表现,增加音色的清晰明亮度,这个频段可延续至3-8KHz;声音听起来发散的话可提升中频,另外混响量不要过度。

(7)4khz 镶边,锋锐感;8khz 高频哨声或齿音,轮廓清晰;16khz 空气感。


2、女声的音色频率调节


女声基音频率在160Hz-1.2KHz左右,泛音可扩展到9-10KHz。<可以的话,在进行处理的一开始,就先加一个BBE或其他的激励器来对音色的高频泛音谐波进行提升,从而令整体音色增强颗粒感和清澈剔透。>

(1)160Hz以下,频率低于女声音域,为无用的低频成分,切除掉;

(2)250-523Hz音区是女声基音主要音域,依实际情况决定是否做提升处理;在320Hz处增加3-5dB,可增强温暖的感觉。增强清晰度是在150-500hz之间的提升。<以上都是围绕女声基音频段而调节的效果,都是为了增强声音的“凸出”和亲切温暖以及清晰感,其实在345hz频点作一定衰减也有可能令人声更加贴近伴奏,特别是需要强调女声飘渺唯美的效果时。>

(3)对中频范围2-4KHz进行提升,其目的是为了使音色结构的泛音表现出良好的频率导通厚实特性,使音色更加完美,这是增加音色明亮度的频段。在2502Hz、4000Hz两个频点上做衰减处理,就相当于削弱了中频的信号,这样的调节相信会更加适用于需表现出冰冷、飘渺效果的女声上面。

(4)10KHz以上频率给予小的提升,目的是为了使音色的色彩有足够的表现力,可对音色微小,细腻的部分加以表现,但要注意高频部分容易产生S音(嘶声),在7-10KHz衰减了3-5dB,可以消除S音 对演唱和声的均衡处理:

1. 标准的高八度合唱,通常使用与主唱相同的均衡设置;

2. 有3-4个不同声部的背景和声,声像范围跨越整个声场(最后有提及),这时要使用不同的均衡设置,要让他们听起来富有空间感并且超凡脱俗:对于高声部和声,我通常过滤掉400Hz以下的频率,对于低声部和声,过滤掉100Hz以下的频率,在不丧失合唱清晰度的前提下尽可能的降低中频(1-4kHz)。在中高频和高频我做了较大提升,直到听前来犹如天使发出的声音。

对念白的均衡处理:

对于那种不许要与音乐相融合的念白,可以让声音尽量厚重,尽可能保留更多的低频。如果想让宣讲者的声音听起来犹如上帝般宏亮,可以根据情况提升60Hz及120Hz。然后提升7kHz附近的高频。有时需要降低一点中频,但要注意不要丧失声音的清晰度。


(五)拉宽声场


把人声的声场拉宽,能有效的调整声音的纵深,从听感上可以感受人声是靠后的而并非飘在伴奏音乐之前而造成一种分离感。

一种方法是利用延迟效果器。延迟效果器一般都是通过“干湿比”来控制延迟声的比例,这个参数需要边听边调,找到最合适的点。

另一种方法就是使用立体声扩张器。利用立体声扩展器来达到拉宽声场的目的可以说很简便且有效,不过要注意的是,这里拉宽的幅度并不能很大,原因在于,过分的拉宽声场,会产生"中空"的不良效应。这一点很多朋友不太注意,经常为了"宽"而无度地做立体声扩展处理,最后人声的声场中间显得很空,实际上也破坏了整体的声场和听感。

要提醒的是,用立体声扩展器,只要稍稍做出一点能让自己听出发音位置在靠后移动的效果就行了,因为立体声效果的制作最好不要在这个扩展器上得到。要制造出真正的立体声音效,还得需要在同期录制的音频中选取几轨效果相对于置中的一轨来听不那么好的音频,先把音量收小,再分别进行相等的左右相位摆放(这是叠加处理方法,同期录音选取最好一段置中,然后有两轨Pan到两边40%,再用两轨Pan到两边100%,像周董这样的歌曲中一般会存在10轨以上的叠加)。


(六)混响

混响器各选项定义:


“低频切点”与“高频切点”(low cut & high cut)

指高低频的滤点,选择低于某频段或者高于某频段的声音信号,将不会在混响器内产生混响效果。一般为了混响声的清晰和温暖,都会把低频和高频去掉一部份。


“早期反射时间”(predelay)

想象我们的声音出去时,首先碰到墙、桌子、窗,等等。因此而产生第一波的反射音,这就叫早期反射。这个参数就是设置反射的时间,单位是毫秒。这个用处不是很大,因为早反射人耳的听觉分辨不大清楚。


“空间广度”(size / room size)

指虚拟中产生混响的空间的大小。调节的数值小,声音在声场的位置靠后,数值大便声音靠前。这个还是比较有用,可以调节声音的位置。


“扩散程度”(diffusion)

指我们的声音的反射音扩散度,和“空间广度”相辅相成。传统上是叫做 Early reflections diffusion(早反射的散射度)。我们知道早反射就是一组比较明显的反射声。这些反射声的相互接近程度,就是 diffusion 。

墙壁越不光滑,声音的散射度就越大,反射声越多,相互之间越接近,混响是连声一片的,声音很温和;墙壁越光滑,声音的散射度就越小,反射声越少,相互之间隔得越开,混响声听起来就比较接近回声了,声音很清晰。


“低混比率”(bass multiplier)

这个是调节声音的厚度和饱满程度。


“分频点”(crossover)

就是高、低频的切分点。和“低混比率”一起调整 。


“残响时间”(decay time)

这个是影响效果的一个主要参数,指混响存在的时间。就是整个混响的总长度。


“高频衰点”(high damping)

指混响声的高频部分衰弱的切点。原理是一般来说混响中的高频是很容易大幅度衰减的。空间越大,空间内物体越多,物体和墙壁表面越不光滑,高频的衰减 就越厉害。只有在中小空间中,并且空间表面比较光滑的情况下,高频的衰减才与低频接近。但我们做音乐混音的时候,有时为了声音的好听,也并不一定要遵循高频更容易衰弱的自然规律。



“原始干音”(dry level)

就是我们进入混响器的原始人声信号的音量。

在混响中,要想使声音听起来离麦克风更远,就把数值拉小,数值越大便感觉声音距离MIC越近。(好多朋友说人声和伴奏不在一体,其实就是声场问题。可以用这个干声调节来配合解决。


“早反射音”(early reflection level)

早期反射音的音量设置。这个不建议调,忽略掉 “混响音量”(wet level / reverb)

混响声的音量设置。也就是混响效果声的大小。

(这个偶还要说么?当然了,你想大就大想小就小,水平高的GGJJ就调小点让人听着嫉妒,水平少点滴DDMM就调大点来遮盖一下哦~)


“声场宽度”(stereo separation)

指我们的声音所在的模拟声场的空间宽度,调整可增大或收窄声音的体积。适合做立体声效果。(辅助调节)

(现代流行乐的人声处理,已经趋向于“小混响”,使用过混响美化效果而不易被听出有混响痕迹就最好!!!)


参考数值


低频切点:466HZ (低频保留越多,声音越低沉。)

高频切点:6.2KHZ (高频保留越多,声音越有穿透力。设置为10KHZ的混响能让声音直冲云霄,当然低些更自然。)

早期反射:0 (不建议调)

空间广度:50 (越大声音越靠前)

扩散程度:100 (保留声音清晰度)

低混比率:? (调节声音厚度和饱满度)

分频点:181HZ (没听出来作用,一直用的这个参数)

残响时间:0.1S (残响时间越长,回声越大。现在流行“小混响”)

高频衰点:10.4KHZ (高音表现力足够的话,可以调高点。)

原始干声:95% (值越小,感觉人声距离麦越远,值越大,人声距离麦越近,这个值请一边预览着试)

早反射声:-INF.DB (不建议调)

混响音量:30% (除“原始干声”外的所有的参数调节的音量输出总和,一般不要调太大)

声场宽度:100%


(六)其他乐器的摆放与频率调节配合

乐器要把人声的频率让开,不能给人听的感觉是乐器一直在抢人声,人声被乐器抢了频率,便会感觉人声很瘦小,被乐器给淹没了。把乐器都摆好位置,并且就频率上作出修改,给人声让出空间和频率。


和声:一般是高音置中,两轨中音放两边,这样人声便从空间到频谱填满整首歌,效果非常饱满。


对Backing Vocals的修整处理


1.首先是声相的摆位:

高音和声(标准的高八度合声):一轨置中;

中音和声(与L.V.演唱同样的旋律):两轨,被分别Pan到左右两边的40% ;

中音和声(与L.V.形成3度音程):两轨,被放至极左和极右。


2.EQ:

高音和声:通常过滤掉400Hz以下的频率,在中高频范围做提升。

中音和声:在157Hz位置放一个高通滤波,在500Hz做10db的衰减,再在5Khz的位置做一个7db左右的衰减。

------华丽的分隔线----------------------------
------华丽的分隔线----------------------------

服务热线

0571-86795773

功能和特性

价格和优惠

获取内部资料

微信服务号