个人资料
正文

人声效果的精细处理 (转载学习中……) ZT

(2008-06-06 18:47:38) 下一个

人声效果的处理,大多数人都是使用反复试探性调节的方法,以寻找音感效果最好的处理效果。此种调音方式的不足十分明显:
   (1)寻找一个理想的调音效果,需经多次猜测,所以需要教长的时间。
   (2)较好的调音效果常常是偶然遇到的,这对于调音规律的归纳总结没什么帮助,并且以后也不易再现。
   (3)不同设备的各项固定参数和可调参数都不尽相同,因而使用某一设备的经验,通常都无法用于另一设备。
   发展到目前的效果处理设备,用于改变音源音色的技术手段并不太多,其中比较常用的只有频率均衡、延时反馈、限幅失真等3种基本方法,然而这些效果处理设备的不同参数组合所产生的音色则大相径庭。
   效果处理器的参数设置可以有很多项,尤其是延时反馈,这种模拟混响效果参数的设置理论上可达几十项之多。当然这些专业性极强的参数,大多数人都难以理解,也不知道如何理解。因此,大部分效果处理设备都只设置一、二个可调参数,并且其可调范围也比较狭窄。这种调整简单的效果处理设备容许人们在上面进行尝试性调整,而不会出现太大的问题。但对于效果处理要求更为精细的调音场合,例如在多轨录音系统当中,则必须使用更为专业的效果处理设备,用以做出更为精细的效果处理。

频率均衡
  很明显,频率均衡的分段越多,效果处理的精细程度也就越高。除了图示均衡,一般调音的均衡单元通常只有三四个频段,这显然满足不了精确处理音源的要求。为了能足够灵活的对人声进行任意的均衡处理,我们建议使用增益、频点和宽度都可调整的四段频率均衡。
   多数频率均衡的可调参数只有增益一项,然而这并不意味着其他两项参数不存在,而且这两项参数为不可调的固定参数。当然这两项参数设置为可调也并非难事,但这些会增加设备的成本,并使其调整变得复杂化。所以增益、频点和宽度都可调整的参量均衡电路,通常只有在高档设备上才能见到。
   实际上,增益、频点和宽度都是可调整的频率均衡,几乎不可能使用胡猜乱试的方法找出一个理想的音色。在这里我们必须研究音频信号的物理特性、技术参数以及他在人耳听感上的对应关系。
   人声音源的频谱分布比较特殊,就其发音方式而言,他有三个部分:一个是由声带震动所产生的乐音,此部分的发音最为灵活,不同音高、不同发音方式所产生的频谱变化也很大;二是鼻腔的形状较为稳定,因而其共鸣所产生的谐音频谱分布变化不大;三是口腔气流在齿缝间的摩擦声,这种齿音与声带震动所产生的乐音基本无关。
   频率均衡可以大致的将这三部分频谱分离出来。用语调节鼻音的频率段在500Hz,以下均衡的中点频率一般在80~150Hz,均衡带宽为4个倍频程。例如,可以将100Hz定为频率均衡的中点,均衡曲线应从100~400Hz平缓的过渡,均衡增益的调节范围可以为+10Db~-6dB。这里应提醒大家的是:进行此项调整的监听音箱不得使用低频发音很弱的小箱子,以避免鼻音被无意过分加重。
   人声乐音的频谱随音调的变化也很大,所以调节乐音的均衡曲线应非常平缓,均衡的中点频率可在1000~3400Hz,均衡带宽为六个倍频程。此一频段控制着歌唱发音的明亮感,向上调节可温和地提升人声的亮度。然而如需降低人声的明亮度,情况就会更复杂一些。一般音感过分明亮的人声大多都是2500Hz附近的频谱较强,这里我们可用均衡带宽为1/2倍频程,均衡增益为-4dB左右的均衡处理,在2500Hz附近寻找一个效果最好的频点即可。
   人声齿音的频谱分布在4kHz以上。由于此频段亦包含部分乐音频谱,所以建议调节齿音的频段应为6~16KHz,均衡带宽为3个倍频程,均衡中点频率一般在10~12KHz,均衡增益最大向上可调至+10Db;如需向下降低人声齿音的响度,则应使用均衡带宽为1/2倍频程,均衡中点频率为6800Hz的均衡处理,其均衡增益最低可向下降至-10Db。
   由以上分析可以看出,对人声进行频率均衡处理时,为突出某一音感而进行的频段提升,都尽量使用曲线平缓的宽频带均衡。这是为了使人声鼻音、乐音、齿音三部分的频谱分布均匀连贯,以使其发音自然、顺畅。从理论上讲,应使人声在发任何音时,其响度都保持恒定。
   为了在不破坏人生自然感的基础上对其进行特定效果的处理可以使用1/5倍频程的均衡处理,具体有以下几种情形:
    (1)音感狭窄,缺乏厚度,可在800Hz处使用1/5倍频程的衰减处理,衰减的最大值可以在-3dB。
    (2)卷舌齿音的音感尖啸,"嘘"音缺乏清澈感,可在2500Hz处使用1/5倍频程的衰减处理,衰减的最大值可以在-6Db。
  对音源的均衡处理,最好是使用能显示均衡曲线的均衡器。一般数字调音台均衡器上的均衡增益调节钮用"G"来标识,均衡频率调节钮用"F"来标识,均衡带宽调节钮用"F"或"Q"来标识。

延时反馈
  延时反馈是效果处理当中应用最为广泛,但也是最为复杂的方式。其中,混响、合唱、镶边、回声等效果,其基本处理方式都是延时反馈。
1、混响
  混响效果主要是用于增加音源的融合感。自然音源的延时声阵列非常密集、复杂,所以模拟混响效果的程序也复杂多变。常见参数有以下几种:
   混响时间:能逼真的模拟自然混响的数码混响器上都有一套复杂的程序,其上虽然有很多技术参数可调,然而对这些技术参数的调整都不会比原有的效果更为自然,尤其是混响时间。
   高频滚降:此项参数用于模拟自然混响当中,空气对高频的吸收效应,以产生较为自然的混响效果。一般高频混降的可调范围为0.1~1.0。此值较高时,混响效果也较接近自然混响;此值较低时,混响效果则较清澈。
   扩散度:此项参数可调整混响声阵密度的增长速度,其可调范围为0~10,其值较高时,混响效果比较丰厚、温暖;其值较低时,混响效果则较空旷、冷僻。
   预延时:自然混响声阵的建立都会延迟一段时间,预延时即为模拟次效应而设置。
   声阵密度:此项参数可调整声阵的密度,其值较高时,混响效果较为温暖,但有明显的声染色;其值较低时,混响效果较深邃,切声染色也较弱。
   频率调制:这是一项技术性的参数,因为电子混响的声阵密度比自然混响稀疏,为了使混响的声音比较平滑、连贯,需要对混响声阵列的延时时间进行调制。此项技术可以有效的消除延时声阵列的段裂声,可以增加混响声的柔和感。
调治深度:指上述调频电路的调治深度。
   混响类型:不同房间的自然混响声阵列差别也较大,而这种差别也不是一两项参数就能表现的。在数码混响器当中,不同的自然混响需要不同的程序。其可选项一般有小厅(S-Hall)、大厅(L-Hall)、房间(Room)、随机(Random)、反混响(Reverse)、钢板(Plate)、弹簧(Sprirg)等。其中小厅、大厅房间混响属自然混响效果;钢板、弹簧混响则可以模拟早期机械式混响的处理效果。
   房间尺寸:这是为了配合自然混响效果而设置的,很容易理解。
   房间活跃度:活跃度,就是一个房间的混响强度,他与房间墙面吸声特性有关,此项参数即用于调节此特性。
   早期反射声与混响声的平衡:混响的早期反射声与其处理效果特性关系密切,而混响声阵的音感则不那么变化多端,所以数码混响器的这两部分的生成是分开的,本参数就是用于调整早期反射声与混响声阵之间响度平衡。
   早期反射声与混响声的延时时间:即早期反射声与混响声阵之间的延时时间控制。此时间较长,混响效果的前段就较清澈;此时间较短,早期反射声与混响声就会重叠在一起,混响效果的前段就较浑浊。
   除以上可调参数之外,混响效果还有一些其他附属参数,例如低通滤波、高通滤波、直达/混响声的响度平衡控制等。

2、延时
  延时就是将音源延迟一段时间后,再欲播放的效果处理。依其延迟时间的不同,可分别产生合唱、镶边、回音等效果。
  当延迟时间在3~35ms之间时人耳感觉不到滞后音的存在,并且他与原音源叠加后,会因其相位干涉而产生"梳状滤波"效应,这就是镶边效果。如果延迟时间在50ms以上时,其延迟音就清晰可辨,此时的处理效果才是回音。回音处理一般都是用于产生简单的混响效果。
   延时、合唱、镶边、回音等效果的可调参数都差不多,具体有以下几项:
    *延时时间(Dly),即主延时电路的延时时间调整。
    *反馈增益(FBGain),即延时反馈的增益控制。
    *反馈高频比(HiRatio),即反馈回路上的高频衰减控制。
    *调制频率(Freq),指主延时的调频周期。
    *调制深度(Depth),指上述调频电路的调制深度。
    *高频增益(HF),指高频均衡控制。
    *预延时(IniDly),指主延时电路预延时时间调整。
    *均衡频率(EQF),这里的频率均衡用于音色调整,此为均衡的中点频率选择。
  由于延时产生的效果都比较复杂多变,如果不是效果处理专家,建议使用设备提供的预置参数,因为这些预置参数给出的处理效果一般都比较好。

声激励
  对音源信号进行浅度的限幅处理,音响便会产生一种类似"饱和"的音感效果从而使其发音在不提高其实际响度的基础上有响度增大的效果。
   一些数码效果器上也配有非线性饱和效果,他就是对信号的振幅处理,模拟大电瓶信号在三极管上的饱和所引起的非线性,从而产生出"发硬"的音感效果。
   由于限幅失真所引起的主要是产生额外的高次谐波成分,因而新设计的激励器,为了使其处理效果柔和一些,都是通过在音源中家置高次载波成分来模拟限幅失真,营造不那么"嘶哑"的声激励效果。
   另外,通过一个用于加强高次谐波的高通滤波器对原信号进行处理,然后再叠加在经延时的原信号上,可以营造出音头清澈的声效果。显然、这种处理方式可以产生出不那么嘈杂的激励处理。
   激励处理类似于音响设备的过载失真,因而对音源的过量激励,会产生令人不悦的嘈杂感。由于早期音响设备的保真度都不高,人们已经习惯了那种稍显嘈杂的音响,而对于音感清洁的高保真度音响,反而不太习惯,感觉其发音过分柔弱。在人声音源当中,除了一少部分经过专门训练的人之外,大部分的发言都缺乏劲度,因而这里的激励处理是十分必要的。
   对人声的激励处理有下面几种情形
  (1)对人声乐音的激励处理,其频谱分布以2500Hz为中点。此种激励的效果比较自然舒适、对增加音源突出感的作用也比较明显。
  (2)对人声鼻音的激励处理,其频谱分布以500Hz为中点。此种激励可以有效地增大人声的劲度感。
  (3)对人声800Hz附近进行激励,可以增加音源的喧嚣感,当然此处理方式的使用应十分谨慎,最好是只用于摇滚乐的演唱。
  (4)对人声3500-6800Hz范围内的频谱,不宜使用激励处理,因为它容易使音源产生令人不悦的嘈杂声响。
  (5)对人声的齿音一般应避免使用激励处理,因为此频段的失真很容易被人察觉。当然如果是使用激励效果比较柔和的数字式激励器,也可以对齿音做轻微的激励处理,以用于加重齿音的清析感。其处理的频谱应在7200Hz以上。
   歌唱发音的激励处理通常要保守一些。在实际的调音当中,激励处理的音感效果有可能随长时间的听音而逐渐弱化,所以在调节激励效果时,时间不要超过10分钟。
   对人声音源的激励处理,最好是使用数码效果处理器。它通常有以下几项调整参量
  1.输入增益(Gmn),用于调节输入电平,注意此处切勿使设备产生过载。
  2.调谐频率(Tuning),根据需要处理的频段,选择一个合适的频率。
  3.驱动电平(Drive),用于调整激励的深度。驱动电平较大时,效果比较嘈杂;驱动电平较小时,效果则比较温和。
  4.混合比率(Mix),即原信号与效果信号的响度比。
  效果处理的整体规划
  对人声音源的精细处理,需要使用1台全数字式调音台,至少3台数字式效果器和一台数字式激励器, 首先在调音台上,使用通道均衡控制单元对人声进行音色调整,以使其音感得以改善,这里给出几个常用的例子。
  (1)8OOHz附近的频段可使人产生某种厌烦感,因而是可在此频段予以最大为15dB的衰减,频带宽度为1/5倍频程,用于改善人声发音的总印象;
   (2)68O0Hz附近的频段可使人声产生尖啸、刺耳的感觉,可在此频段予以最大为10dB的衰减,频带宽度为l/5倍频程,用以减弱齿音的尖啸感;
   (3)对于发音过亮、有炸耳棍子的感觉者,可在3400Hz处予以最大为8dB的衰减,频带宽度为1/3倍频程;
   (4)对于鼻音过重者,可在500Hz以下频段适当衰减,衰减带宽为3倍频程;
   (5)齿音的超高频段由于受人耳灵敏度的影响,需对12KHz处提升6dB(频带宽度为2倍频程),其响度才能与人声的乐音平衡。
  以上均衡处理较适用于现场扩音,如果是多轨录音或节目转发,则应将增益的调节量减半。
  均衡调好之后,再调节激励器。先将激励器的驱动电平和混频电平调至最大状态,频率调谐放在2500Hz,此时如果其发音已显嘈杂,或音色过硬,可将驱动电平调低,应注意这种调整有变化的是音源的硬度。如果驱动电平调在较高的位置,而只将混频电平调低,则高硬度声响的音响保持不变,但它会被未经激励处理的原声略微掩盖。此一现象在激励深度很强时比较明显,其中前一种发音给人的听感就是原声,后一种则可产生出两层声音,它具有增加人声层次感的效果。
  一般1台激励器只能处理一个频段,并且很多单一功能激励器的连接都要求不能并联,只能串联。如需对音源的多个频段加激励,这里建议在附图所示的设备连接当中,混响器应选用含有激励处理的多重效果器(如YAMAHASPX990),此时就可以用激励器处理500Hz、800Hz和7200Hz频段,用混响器上的激励功能处理2500Hz频段。
   再次提醒大家的是,激励处理的调整时间不能太长,以免人耳疲劳后,无法准确辨认激励的程度是否合适。
   最后就是调整混响效果。这里的混响效果包含两个方面,一个是基础润饰,另一个是强染色。
   混响处理的基础润饰,主要是为了增加音源的融和性,但又不能让人听出有房间残响。此处的混响处理的强染色效果,主要是用于为音源生成余音缭绕渲染性,其处理方式有以下3种情形:
  (1)生成空间感。使用厅堂或房间混响效果。模拟余音明显的自然混响效果,是混响处理简单而又有效的方式,对此效果通道上3500Hz附近的频段稍作提升,可以产生穿透感良好的高亮度声响。当然,也有一个缺点,即处理的效果比较浑浊,有时带有一种"闷罐"声响。
   (2)生成回音。长延时时间的延时反馈处理,可以模拟山谷回音效果;处理的延时时间一般都与演唱歌曲的节奏合拍。为使其效果更具有遥远感,可对其1600Hz以下和3800Hz以上的频段适量衰减。模拟山谷回音效果,很多数码效果处理器上都有现成的程序可供使用。
   (3)生成融和的声背景。余音缭绕的混响效果对人声音源的美化作用非常有效,几乎所有的人声演唱都要使用混响。在不导致其发音变浑,或引起"闷罐"声的前提下,我们认为混响效果越强越好,但实际常常是混响效果还很弱时,其发音已经变浑,并引起明显的"闷罐"声。
   为了在不导致其发音变浑,或引起"闷罐"声的前提下,生成融和的声背景。下面推荐如下效果处理方式,即延时一混响串联处理方式。此种处理的延时时间一般为200-600ms,反馈增益40%-60%,混响使用大厅混响效果,混响时间为2-8s。串联处理后的混响效果要求平滑、连贯。如果处理后的声响音头毕露,则可作如下调整,一是缩短延时时间,二是增加混响的响度,三是增大混响的时间。
   混响处理的强染色效果,一般都应在基础润饰的前提下进行,这样强染色处理就可以弱一些。


均衡器的调整方法:
  超低音: 20Hz-40Hz,适当时声音强而有力。能控制雷声、低音鼓、管风琴和贝司的声音。过度提升会使音乐变得混浊不清。
  低音: 40Hz-150Hz,是声音的基础部份,其能量占整个音频能量的70%,是表现音乐风格的重要成份。 适当时,低音张弛得宜,声音丰满柔和,不足时声音单薄,150Hz,过度提升时会使声音发闷,明亮度下降,鼻音增强。
  中低音: 150Hz-500Hz,是声音的结构部分,人声位于这个位置,不足时,演唱声会被音乐淹没,声音软而无力,适当提升时会感到浑厚有力,提高声音的力度和响度。提升过度时会使低音变得生硬,300Hz处过度提升3-6dB,如再加上混响,则会严重影响声音的清晰度。
  中音: 500Hz-2KHz,包含大多数乐器的低次谐波和泛音,是小军鼓和打击乐器的特征音。适当时声音透彻明亮,不足时声音朦胧。过度提升时会产生类似电话的声音。
  中高音: 2KHz-5KHz,是弦乐的特征音(拉弦乐的弓与弦的摩搡声,弹拔乐的手指触弦的声音某)。不足时声音的穿透力下降,过强时会掩蔽语言音节的识别。
  高音: 7KHz-8KHz,是影响声音层次感的频率。过度提升会使短笛、长笛声音突出,语言的齿音加重和音色发毛。
  极高音: 8KHz-10KHz 合适时,三角铁和立*的金属感通透率高,沙钟的节奏清晰可辨。过度提升会使声音不自然,易烧毁高频单元。

2、平衡悦耳的声音应是:
  150Hz以下(低音)应是丰满、柔和而富有弹性;
  150Hz-500Hz(中低音)应是浑厚有力百不混浊;
  500Hz-5KHz(中高音)应是明亮透彻而不生硬;
  5KHz以上(高音)应是纤细,园顺而不尖锐刺耳。
整个频响特性平直时:声音自然丰满而有弹性,层次清晰园顺悦耳。频响多峰谷时:声音粗糙混浊,高音刺耳发毛,无层次感扩声易发生反馈啸叫。

3、频率的音感特征:
  30~60Hz 沉闷 如没有相当大的响度,人耳很难感觉。
  60~100Hz 沉重 80Hz附近能产生极强的“重感”效果,响度很高也不会给人舒服的感觉,可给人以强烈的刺激作用。
  100~200Hz 丰满
  200~500Hz 力度 易引起嗡嗡声的烦闷心理。
  500~1KHz 明朗 800Hz附近如提升10dB,会明显产生一种嘈杂感,狭窄感。
  1K~2KHz 透亮 2800Kz附近明亮感关系最大。
  2K~4Kz 尖锐 6800Hz形成尖啸,锐利的感觉。
  4K~8Kz 清脆 3400Hz易引起听觉疲劳。
  8K~16Kz 纤细 >7.5KHz音感清彻纤细。

均衡器的发展趋势
  运用数字滤波器组成的均衡器称为数字均衡器,数字均衡器即可作成图示EQ,有可做成参量EQ,还可以做成两者兼有的EQ,它不仅各项性能指标优异,操作方便,而且还可同时储存多种用途的频响均衡特性,供不同节目要求选用,可多至储存99种频响特性曲线。SONY的SRP-E300是一款多功能2通道的数字均衡器具有10段参量均衡和29段图示均衡,可同时或独立工作,带有限制器和噪声门功能,高精度的48kHz取样,20比特线性模数/数模转换;带有模拟和数字输入/输出;RS-232C C接口,可用于外部遥控,,它的出现会逐步淘汰普通的模拟均衡器,是一款专业音频扩声领域具有极高性价比的产品。

  P.S.
  1、20~40这个频段声音的大部分感觉是松软的低音,而不是强劲有力,通过试验就可以知道。看看给地鼓提升这个频段会有什么效果。
  2、40~150是声音的基础没错,但是绝占不到70%,而且人声的鼻音也不在这个频段,大概在250左右。
  3、150~500这频段,是个要在处理的时候非常小心的频段,绝不能靠提升这频段来获得人声的力度。稍不小心就会一团遭。
  4、“300Hz处过度提升3-6dB,如再加上混响,则会严重影响声音的清晰度。”应该说只要在低频部分加混响,都会影响声音的清晰度。当然,在现在的混音技巧中,这个规则已经不是很重要了。因为,我们经常会在欧美及港台的录音室里见到他们为地鼓和贝司加超短程混响

[ 打印 ]
阅读 ()评论 (7)
评论
e梦圆 回复 悄悄话 真是太高深了,看得我头都大了。太佩服四哥了!
北美小朱 回复 悄悄话 哈哈~~~难怪四哥的后期做的那么好!原来有这么多的经验。看来后期真的是一门很深的学问啊。
fourshadow 回复 悄悄话 回复断翅的雨蝶的评论:
谢谢雨蝶来访,欢迎互相探讨。共同进步。
断翅的雨蝶 回复 悄悄话 好详尽的描述,难怪是精细的人声效果处理呢:-)
刚刚开始学着使用cooledit,从您这转载收藏了许多相关学习的帖子,非常感谢!
fourshadow 回复 悄悄话 问梦儿好!这个可以参考。说的也不一定全都对。
我是梦儿 回复 悄悄话 学习~问好四哥 :)
登录后才可评论.