本篇论文提出了一种新的构建复杂谐振器模型的方法,以小提琴的共鸣箱为例,探讨在实时合成小提琴音色时如何兼顾计算精度与成本之间的平衡。小提琴的共鸣箱对从琴弦通过琴桥传播的振动起到滤波作用,对塑造乐器特有的音色至关重要。若为每一个共振分别配对一对滤波极点进行精确建模,计算成本过高;而如果仅采用少量滤波极点忽略大量共振,则无法充分再现小提琴复杂的滤波特性及其对音色的独特贡献。
论文详细阐述了小提琴共鸣箱的共振特性与感知现象。共鸣箱作为弦振动的共振腔,其内部空气腔模式与面板模式相互耦合,共同形成了对声音强烈影响的复杂滤波过程。在3kHz以下低频段,木材质主导的振动模式占优;而在3kHz以上高频段,空气腔模式成为主导。通过实验测量得到的小提琴共鸣箱脉冲响应如图1所示,呈现出丰富的高频共振峰。
在较低频率下,人耳对共振模式的精确调谐非常敏感,因为这一频段内耳的频率分辨率较高。然而,在更高频率范围内,人耳的频率分辨力变差,只要时间域特性(由共振带宽和相位决定)在听感上足够相似,对频谱包络形状的“合理”近似即可被视为感知上的等效。
论文介绍的模型结构中,将第二阶谐振滤波器用于模拟前13个共振(约至3200Hz),同时使用波导网格来近似小提琴共鸣箱在更高频率下的密集模式。这些滤波器主要模拟木质振动模式,而网格则更多地模拟空气腔模式。因此,三维波导网格能提供最接近实际的模态密度,但同时探讨二维网格在心理声学层面是否足以模拟高频模式也是有价值的。
模型结构中,拉弦模型计算出的琴桥速度同时输入到谐振滤波器和波导网格中,两者的输出结果相加,形成最终合成信号,如图2所示。
在设计波导网格时,目标是找到一个具有与已去除低频确定性谐振器后所得到的高频残余响应相匹配冲击响应的网格。依据心理声学原理,可将高频模式按听觉临界带(如巴克或ERB频率尺度)分组,每组内统计上相似的模式分布被认为在音乐意义上等价。设计过程中需在每个临界带内匹配共鸣箱响应的以下参数:
- 平均模式间距
- 平均带宽(衰减时间)
- 模式幅度分布
- 模式相位分布
尽管进一步细化可以考虑在每个临界带内统计描述模式带宽分布,但当前模型并未支持这一精细程度。通过使网格尺寸与真实小提琴共鸣箱相近,自然获得类似的模式间距。网格内的模式相位被认为是随机化的,无需显式逼近。
调整平均吸收率以在几个定义高频模式群的高频带内实现相同的平均衰减时间。模式幅度分布则通过线性预测方法计算得出其谱包络表示。
模拟结果显示,针对小提琴E弦(659 Hz)的模型表现出良好的性能。图8展示了不同时间间隔下琴桥处传出速度的波形、谐振滤波器和网格的输出以及它们的综合效果。图9揭示了共鸣箱模型对拉弦音色频谱的影响,特别是频响在2kHz以下及8kHz以上的空缺,这反映了网格模型专注于模拟高频空气腔模式的特点。
论文结论指出,所提出的混合型小提琴共鸣箱模型在计算效率与感知质量之间取得了良好平衡,其低成本特性使其适用于实时小提琴音色合成,并且该技术有望推广应用于其他弦乐器以及其他具有复杂谐振器和非线性激励机制的乐器建模。
|