声学—语音识别技术-语音学-语言学-学海泛舟

首页 >> 语言学 >> 语音学

声学

汪德昭应崇福李启虎张家騄

1 一门古老而又年轻的科学

1．1 声学的研究对象

声学是物理学中发展最早的学科之一．它是研究机械振动在弹性媒质（气体、液体或固体）中传播规律的学科．它的起源可追溯到古代人类对于听觉、语言、音乐等的认识，到19世纪中叶，便已发展为一门体系较为严密的学科，当时瑞利所著的《声学理论》就是一部总结经典声学理论的巨著．

20世纪以来，声学的研究对象已从“可听声”延伸到人耳无法听到的次声和超声、特超声，其应用范围已遍及国民经济各个部门及国防和人类的日常生活．声学与其它学科互相结合互相渗透，形成了不少新的边缘学科．如电子音乐、语言合成、语言识别、声呐工程、激光超声、超声诊断和超声医学等．

声音是一种机械振动的传播．我们人类生活在一个充满声音的世界里．在空气中的某一物体一旦发生振动，它就会引起物体周围媒质的运动，这种运动会一直向远处扩散开来，物体的振动也就被带到四面八方了．当这种振动传到我们耳朵里时，会引起鼓膜的同样的振动，这种振动经过一系列复杂的传导到了大脑的听觉神经，我们便有了声音的感觉．显然，没有空气，我们就听不见声音．所以要听到声音，有两个很重要的条件，一个是振动的物体，一个是传播这种振动的媒质．

空气、水和固体都可以是传播机械振动的媒质．

声音在传播过程中还会引起物质的光学、电磁学、力学、化学性质方面的变化，而这些变化反过来又将影响声音的传播．同时，声音的刺激会对人类生理、心理发生作用并引起某种变化．所以，声学研究的范围很广，分支很多，粗略地说来，包括大气声学、水声学、电声学、超声学、建筑声学、音乐声学、语言声学、心理声学、生理声学等。

1．2 声学发展简史

现代声学的研究可以追溯到英国的伟大物理学家牛顿的工作．他在1687年推导了声速公式，但因为用错了常数，使实际测量的声速值与理论不符．直到1816年，拉普拉斯提出气体的弹性恒量应采用绝热过程（而不是恒温过程）的弹性恒量，而使理论与实测的值达到一致．

德国人克拉尼（1756～1827）是实验声学的创始人，他的名著《声学》是声学方面的第一本教科书，出版于1802年．一般认为，现代声学基础的奠基者是杰出的英国物理学家瑞利（1842～1919）．他在声学、振动理论、光学理论及热辐射方面都有贡献．他于1877年发表了《声学理论》，基本上完成了声学的数学理论．

声学的发展和无线电电子学的发展是分不开的．这里首先要提一下的是能把电信号变成声信号和把声信号变成电信号的换能装置．1861年赖斯发明了第一个扬声器．他在磁棒上绕上线圈，然后把它放在一个共振匣内，当变化的电流通过线圈时，由于电磁感应，线圈发生振动，通过共振匣发出了声音．1877年美国大发明家爱迪生发明了机械留声机．它由一个用锡箔包着的圆筒和装着针尖的膜片组成．当人对着话筒说话时，声压就从膜片传到针尖，转动锡箔圆筒，针尖就在锡箔上刻出沟纹．这一发明使人类第一次可以把声音存贮起来．

水声方面的奠基性工作是法国物理学家朗之万（1872～1946）完成的．他于1914年利用电容发射器和一只放在凹镜面焦点的磁粒微音器在水下进行实验，接收到了海底回波以及200m以外的一块装甲板的回波．1917年设计了第一台实用的回声定位仪．利用它，人们第一次收到了潜艇的回波．此后水声在军事上的应用日见显著，特别是第二次世界大战，促使各国科学家从事声呐的研究，使水下反潜战的技术水平有了巨大的改观．美国海军实验室的乌立克博士总结了他近30年的工作，发表了《水声工程原理》一书，可以说是对这方面工作的一个很好的总结．

目前水声学已不只在军事上获得应用，在海洋开发方面也有许多应用．例如近海油气田的数字地震勘探，大洋测温监视全球环境，失事飞机、海难救助的定位等．

超声在医学方面的应用开始于70年代．1972年发明了一种可以显示人体内脏器官的超声仪器，即B模式扫描超声诊断仪（俗称B超）．将它用于产科诊断，获得了满意的结果．此后，各种不同体系结构的B超大量投入市场．目前，高分辨的彩色B超所得到的图像可与解剖图媲美．近年来超声方面的一个重大进展是声表面波器件．1885年，瑞利在理论上预言声波在某些固体上传播时，能量将集中于表面．1965年第一次用叉指换能器有效地产生了声表面波．于是声表面波器件获得了广泛的应用．目前已在电视、通信（无绳电话、寻呼电话）及雷达等方面使用声表面波器件．

次声学的研究也有很好的应用领域．利用空气中的次声可以侦察核爆炸．从1961年开始，美国在蒙大拿州的一块方圆几十平方公里的荒地上挖了深井，用于地震监视及侦察地下核爆炸．

噪声污染已与空气、水的污染并列为人类环境的三大污染，所以噪声控制就是各国所重视的解决环境问题的重要课题．各种消声方法，包括减振、人为屏蔽、有源消声等正在一些工业领域获得应用．

在声学发展史中值得一提的还有生物声学．其中蝙蝠和白鳍豚是两种在仿生学中有重大价值的动物．20世纪初，美国生理学家葛拉姆包斯指出，蝙蝠会用喉头发射超声，而用耳朵接收回声，因而可以在黑夜中飞行与捕食．我国特有的一级保护动物白鳍豚是美国学者米勒1918年根据洞庭湖上的标本定名的．研究表明，它有非常独特的回声定位系统．1980年1月我国在洞庭湖上捕获一头白鳍豚，取名“淇淇”，现驯养于中科院武汉水生所．

语言声学和生理声学是研究人类发声和语声，以及对声音感受的声学．G．S．欧姆（1787～1854）提出了声音是由许多频率合成的概念．亥姆霍兹发展了这一概念，采用谐振腔（我们现在正是以他的名字来命名的）对语言进行频率分析，从而奠定了语言声学的基础．他还对人耳听觉进行过研究，开创了生理声学这一分支．

建筑声学的发展也很早，它和古代宫殿、教堂和剧院的建筑有关．由于声波传播速度远比光波低，在室内传播时会发生多次反射而互相干涉．室内任何一点的声强度都是一个相当复杂的量．直到1900年赛宾提出了混响的概念，人们才对很多声学现象有了较好的理解．

1．3 我国古代的声学研究

我国是世界上的文明古国．根据对现存的有关古书及文物的考证可以看出，我国古代有关声学方面的知识是从制造、使用乐器开始的．早在公元前11世纪的商代，我国已能制造石磬（音qìng）和成套的铜铙（音náo）等乐器．经过对河南安阳大司空村出土的商代后期铜铙的研究，可以推测当时已具有现代十二音律中的九律，并已有了五度谐音的概念．

根据《汉书·律历志》记载，在西周后期（公元前11世纪）已用各种质料制作乐器，提出所谓“八音”，即

土曰埙
匏曰笙
皮曰鼓
竹曰管

丝曰弦
石曰磬
金曰钟
木曰柷

中国是世界上制造乐钟最早的国家．编钟是我国古代的一种重要乐器．1978年在湖北随县出土战国时代曾侯乙编钟，附有钟架、配件，精美罕见．墓葬时间为公元前433年．全部3层，64件，总重超过2500kg．这套编钟总音域跨五个八度，可以演奏出完整无缺的半音阶．

公元前4～3世纪间成书的《墨经》中有大量的有关声学方面的记载．其中有一段关于利用挖地井埋缸听测地声的记录．这种方法，现代仍在使用．

我国东汉时期的思想家王充（约27～99）在《论衡》中曾有关于喉舌鼓动空气而发声的叙述．到了明朝，著名学者宋应星明确提出声波的概念．他在《论气·气声篇》中指出“气体浑沦之物……冲之有声焉，飞矢是也；振之有声焉，弹弦是也”．

明朝朱载堉（1536～1614）发明了音律中的十二平均律．他的《律学新说》发表于1584年，比欧洲最早提出十二平均律的梅尔生早52年．朱载堉在计算时，小数点后精确到第25位．他的工作受到德国杰出物理学家亥姆霍兹的高度评价．可惜，由于封建社会的局限，朱的十二平均律被认为是异端邪说而被扼杀了．

在我国，一些古建筑中还有一些巧妙地利用声音反射、共鸣特性的．其中最著名的就是北京天坛的回音壁、三音石、圆丘．此外还有山西永济县的莺莺塔．

1．4 近代声学在国民经济、国防及人类日常生活中的作用

图5-1给出了现代声学的各分支和它们的基础以及同其它科学技术的关系．

图5-1的中心是基础物理声学．第一个环是声学的分支学科．第二个环是相关的应用学科及领域．它的最外层是分属学科的五大类．我们从图上可以看到，人类的活动几乎都与声学有关．从海洋学到语言音乐，从地球到人的大脑，从机械工程到医学，从微观到宏观，都是声学家活动的场所．声学的边缘学科性质十分明显，它不断有新的生长点出现．在第二个环和第四个环之间是一门与各学科都紧密相关的新领域，即信号处理理论与技术．它是与现代蓬勃发展的计算机技术和微电子技术同时掘起的新领域．

物理声学和理论声学是各分支的基础．它研究各种机械振动的原理和声波的收、发器．近年来，非线性声学也有引人注目的发展．

音乐声学探讨各种乐器制作过程中的定音、音调及音色的机理，为向人们提供各种悦耳的乐器提供理论指导。

语言声学和生理声学研究人类发声和对声音的感受．随着近代信息科学的发展，语言合成，语言识别的理论得到迅速发展．人机对话系统正在成为研究的热点．生理声学的研究和心理声学相结合为环境噪声的评价及噪声控制标准提供基础．

建筑声学为现代大型剧场、大会堂的设计提供声学指导，也为城市噪声控制提供标准．对噪声和振动的研究还是和国防密切相关的课题．火箭、导弹飞行时的振动及其控制一直是衡量它们总体性能的重要指标．

电声学的发展和近代通讯技术紧密相关．通讯、广播及日常生活中所使用的各种高音质音响设备为丰富人们的文化生活起着越来越大的作用．

超声及其应用是近代声学发展最迅速的新兴分支．超声无损检测、超声诊断、超声医疗已在工业及生活方面发挥作用．

水声学是近代声呐设计和海洋开发的技术基础．军事上所用的声呐设备及海洋开发中所用的地震勘探设备、剖面仪等都是利用水声技术研制出来的．

2 声学的基本概念与理论

2．1 声波与振动

声学的基本理论在于研究振动与波的传播．如果质点振动的方向与波的传播方向相同，就称为纵波．如果质点振动方向和波的传播方向垂直，就称为横波．

在空气和水中，机械振动只能产生纵波．在固体中除了纵波之外，还可能有横波．图5-2表示在空气中机械振动所引起的空气疏密状态的变化．质点的这种变化，使声能向四周扩散．在声波传播的过程中，质点本身并不随声波向四周扩散，它只在某一固定点附近来回运动．它的加速度总是与运动路径上离固定点的距离x成正比，而其方向指向固定点．这种运动，我们称之为简谐运动．它是周期运动的最简单的形式．用微分方程来表示，就是

它的解是

x（t）=Asinωt+Bcosωt （5.2）

其中A，B是任意常数，ω是圆频率，单位是rad·s-1（弧度·秒-1）．我们有时也用f=ω/2π来表示质点每秒振动的次数，单位为Hz（赫兹）．现代声学研究的频率范围为10-4Hz～1014Hz如表5.1所示．

表5.1 声学中的频率范围

范围名称
频率/Hz
范围名称
频率/Hz

次声
10-4～20
超声
2×104～1014

可听声
20～2×104

声波在媒质中的传播速率为

其中E是媒质的弹性模量，单位为Pa（帕），ρ是媒质密度，单位是kg·m-3．

声波在15℃的空气中的传播速率为c=340m·s-1，在淡水中c=1440m·s-1，在海水中c=1500m·s-1，在钢中c=5000m·s-1．

声波在传播过程中把机械振动的能量向四周扩散．声波的声强被定义为每单位面积上沿波传播方向传递的平均功率，即

其中prms是有效（均方根）压强，单位为N·m-2（牛顿·米-2），ρ是密度，单位为kg·m-3（千克·米-3），而c是声速，单位为m·s-1（米·秒-1）．

由于在声学环境中会遇到量程很宽的声压和声强，所以通常把声强与某一基准声强I0的比值取对数之后来度量，也就是声强级

IL=10lg（I/I0）dB（分贝）（5.5）

I0也称为参考声强级．

声压级

SL=20lg（p/p0）dB （5.6）

其中p0是参考声压级．

在空气声学中，一般把人耳能听到的最低声压级（称为可听阈）取作参考声压级，这个值大约是

p0=2×10-5N·m-2

或20μPa（微帕）．以此为标准，可以得到表5.2．

表5.2 声压级

名称
声压级/dB
名称
声压级/dB

人耳最低可听阈
0
交响乐团演奏，10m处
80

普通谈话，1m之内
60
人耳痛阈声压
120

在水声学中，通常取p0=1×10-6N·m-2，即1μPa为参考声压．一般千吨级的货轮的螺旋桨在航速为18km·h-1时，在离它100m处接收到的声压大约是90dB．

2．2 波动方程

具有质量和弹性的系统都能作相对运动．如果在一个给定的时间间隔之后，该系统的运动重复出现，这样的周期运动就称为振动．振动产生声波．为了刻划振动体各点的运动情况，必须了解物体振动时所遵循的规律．这种规律的特点除了受物体本身的形状、质量及弹性特征的控制之外，也受到外界媒质及振动条件的限制．

描写物体振动的方程通常是二阶微分方程，称之为波动方程．加上各种边界条件就可以把波动方程的解求出来．这就是声波．

最简单的声波形式是平面波．空气在受到扰动时，通常以纵向正弦波的方式通过三维空间传播．假定在y和z方向没有压力变化，可以把沿x方向传播的一维自由行波定义为平面波．波动方程是

其中c是波的传播速度，u是瞬时位移．式（5.7）的通解是

u（x，t）=Aej（ωt-kx）+Bej（ωt+kx）（5.8）

其中k=ω/c称为波数．A、B是由初始条件和边界条件确定的常数．

除了平面声波之外，另一种简单的声波形式是球面波．一个脉动球的表面在其平衡位置附近径向膨胀和收缩时，将使声波以球面波形式向外扩散．在球坐标中，三维波动方程可以写成

其中p是声压，r是从声源到波阵面的径向距离．方程（5.9）的解是

其中f，g是任意函数．

在直角坐标系中，一般的三维波动方程是

其中p是声压，c是声速．根据各种不同的具体条件（初始条件、边界条件）可以把式（5.11）解出来．例如弦、棒、平面膜、圆板等的振动．

2．3 声波的传输

声波的传输包含了声能在传声媒质中的转移．声波通过媒质行进时，会发生反射、折射、衍射、散射、干涉或吸收等现象．声波在穿过不同媒质时是如此，在同一媒质中传播，只要媒质存在某种不均匀性（包括密度分布、温度分布、水中的深度分布等）也会发生这些现象．下面我们分别说明声波传输过程中的基本量．

1．声功率反射系数αr

对于正弦平面声波从一种流体媒质传输到另一种流体媒质，且沿两媒质的分界平面法向入射的情况，其声功率反射系数αr定义为反射声能流与入射声能流之比，即

其中ρ为媒质密度，c为媒质中的声速．ρ和c的乘积称为这种媒质的声阻抗：Z=ρc．从式（5.12）可以看到，如果两种媒质的声阻抗相近，那么反射系数αr很小；如果两种媒质的声阻抗相差很大（例如水和空气的特性阻抗之比大约是3 560），那么反射系数近似为1．声波无论是从空气到水还是从水到空气基本上全部反射回去．由此我们不难理解，为什么在游泳池中，一旦我们把头没入水中就听不到空气中的嘈杂声音了．

2．声反射声折射

每当传播声波的媒质中有间断或有两种媒质的分界面时，声波就会反射与折射．它们分别遵循反射定律与折射定律．

参看图5-3．反射定律是说，入射声波与法线的夹角（即入射角）等于反射声波和法线的夹角（即反射角）．折射定律是说，折射角与入射角的正弦之比等于两种媒质声速的比，即

根据折射定律，如果声波是从声速低的媒质往声速高的媒质传输（例如，从空气到水）就存在一个临界角θc，超过这个临界角会产生全反射．

3．声衍射

声波遇到障碍物时，它们就绕障碍物的边缘延展，引起声的衍射．现实生活中，声衍射的现象随处可见．例如当我们在房间里讲话时，不是正对门口而在门外的人也能听到．

4．声散射

当声波碰到线度小于其波长的障碍物时，声波就朝各个方向散射．一般来说，波长短的声波具有较强的散射效应．

5．声干涉

如果频率和振动方向相同，且相位差恒定的两列声波在空间相遇，它们不是彼此抵消就是彼此加强，这种现象称为声的干涉．

6．多普勒效应

当声源相对于波的传播媒质而运动，或观察者相对于媒质而运动，或声源和观察者彼此间以及与媒质有相对运动时，观察者检测到的声源频率将不同于声源所发声波的实际频率，这种现象称为多普勒效应．

观察者听到的声波频率是

其中f为声源原来的频率，v是观察者相对于媒质的速度，u是声源相对于媒质的速度．利用多普勒效应可以测定一些运动物体的速度．

坐火车的人都有这样的经验，当一列鸣笛的火车相对我们呼啸而过时，声音由低变高再重新变低，这就是多普勒效应的最简单的例子．

3 听觉、语言和音乐

经过长期的发展进化，人生来便具有精细的发音器官和听觉器官．一个人从呱呱坠地时起，便与声学终生密切相关．语言是人类最重要的交际工具．语言也是人类的思维工具．通过语言人们可以传递信息交流思想，增强相互交往，促进社会进步．音乐是人类文化生活中最重要的组成部分．语言和音乐都是通过声波的形式来体现的．人的听觉器官是最灵敏的声音接收器．所以，听觉、语言和音乐是人类最早开始研究的声学问题．

在近代信息社会的发展中，人们创造出了各种信息机器，用以延伸人类天生的器官．人工智能研究的成果，将逐渐使电子计算机成为名副其实的“电脑”．当前，国际上努力实现的人类长期的幻想——人机语言通讯系统，使声学研究进入了一个新阶段．电子乐器，计算机作曲，机器演奏的交响乐，使音乐世界更加丰富多彩．这些都是近代声学的热门课题．

3．1 听觉

双耳是人的听觉器官，它非常灵敏．人的听觉能感受到的最小声压已接近于空气中分子热运动所产生的声压，能感受的频率范围约为20Hz～20000Hz，宽达十个倍频程（即十个“八度”）．人耳能感受的强度范围约为10-12W·m-2～1W·m-2，大小相差1012倍．

1．级和分贝

在声学中声音的强度或压力常用级来表示，它的单位是dB（分贝），见式（5.5）及式（5.6）．这样上面说到的人耳能听到的最小的声音与最大声音之间强度相差1012倍，也就是声级相差120dB．

2．响度和响度级

一个声音在听觉感受上有多响，并不与这个声音的物理强度成线性关系．所以在普通声学中，除了有一套物理量之外，与之对应的还有一套心理量，用以表示声音在主观感受上的程度．一个声音有多响除了与它的强度大小有关外，还与它的频率高低有关．根据世界上许多国家对不同种族的大量正常人所测得的响度级与声压级和频率的关系，称为等响曲线，示于图5-4．

响度级的单位是phon（方）．一个声音的响度级等于等响的1000Hz纯音的声压级．与人的感受成正比的声音大小的量称为响度．响度的单位是sone（宋）．它是以响度级为40phon的声音的响度为1sone来定义的．两倍响即为2sone．实验表明，响度级每增加10phon，响度增加一倍．

3．音调

一个声音在听觉感受上有多高，主要与它的频率有关，但是它的强度也起很大作用．如果一个声音里包含许多频率成分，它的音调高低就更复杂．

音调高低的心理标度单位为mel（美）．它是以1000Hz，40phon的纯音的音调作基准，定为1000mel．要是一个纯音听起来比它高一倍，即为2000mel，要是低一半就是500mel，依此类推．

4．双耳效应

人们判断声源的方向与距离，要靠两个耳朵来接收，特别是觉察声源运动，从嘈杂的环境中倾听一个较弱的声音等，靠的都是两个耳朵的功能，这称之为双耳效应．人们熟知的立体声就是利用双耳效应．双耳效应的主要作用，来自于声音到达两个耳朵的时间差．头部左右转动，可以提高声音定位的准确程度．在有混响的地方，如音乐厅、电影院，定位只依赖最先听到的声音在两耳的时间差，这是立体声系统的根据．

3．2 语言

语言首先是有声语言，是与人类同时发展进化而来的．人的发音器官也是一具复杂而灵巧的机器，它主要是说话和唱歌，当然也可以发出各种声音．发音器官由肺、气管、声门、咽腔、口腔和鼻腔等构成．口腔中又有非常灵活的舌头．上腭、软腭、上下齿和双唇等部件．肺是能源，声门由声带振动调制气流使成交变信号．再经过声道（口腔、鼻腔、咽腔）加以滤波形成不同的简正振动方式，由口和鼻（如果是鼻音的话）辐射到空气环境中便是语音了．

语言是由语音（包括元音和辅音）按一定规则编排组合而成．在声学上来看，不同的语音特征，体现在它们具有不同的时间-频率特性上．

1．语言频谱和动态范围

人们日常谈话辐射的声功率平均约为10mW，耳语时最低声功率只有0.001mW；有训练的歌唱家最高可能产生1W的功率．所以语言信号的功率是不大的，可是它所能传递的信息是无限的．

语言频谱有两种，其一是表示语言整体长时平均特性的长时平均频谱．从现有的多种语言的测量结果来看，各种语言的长时平均频谱是大同小异的．语言信号的频带约在100Hz～10000Hz，主要频段约为100Hz～4000Hz．不传送基音的电话语言则定为300Hz～3400Hz．在每个频带之中语言信号的动态范围约为30dB．再加上不同频带之间低频最强的频率成分（约在300Hz附近）与高频最弱的频率成分还要有30dB～40dB的差别．

标准的正常说话声级，在距发音人唇部一米处的声级约为65dB（男人高些，女人低些）．

语言的另一种频谱是短时频谱．发音是一个连续慢变过程．用短时频谱来表示不同语音的声学特征．从声源看，语音声源可分为：准周期激励、噪声激励和脉冲激励三种．有的语音是由它们三者的某种组合构成的，如浊辅音就可能是由第一种准周期激励（声带振动），再加上第二种或第三种噪声激励所构成（如汉语的浊声母r，英语的浊辅音b、d、g）．

由于声道的不同形状可产生出不同语音，也就有不同的简正方式，表现在语音短时频谱上，称之为共振峰．

2．语言合成与语言识别

人们早就向往着让机器说话和听话．我国的“封神演义”和西方的“天方夜谭”都有着这种幻想．有文献记载，我国唐代就曾有过用木头做的托钵僧，可以发出“布施”的音来．这可以说是世界上最早的会说话的机器．18、19世纪西方也有用机械方法合成语音的．直到1939年才出现第一架采用电子线路的发音演示器．其工作原理是利用电子线路来模拟语音激励声源，调整共振线路逼近语音频谱．人用键盘操纵，经长时间训练可摹拟人说话．现在采用数字信号处理技术和语言声学的基础知识与特征参数，已经可以合成出任何声音．

让机器能听懂人说话，从而用口语指挥机器，做起来要更难一些．其基本原理，是利用实时的信号处理方法，提取语音信号特征，根据机器受过的训练，即所存贮的语音特征模式和必要的语音学、语言学知识，来做出识别和判断，这称为语言识别．语言识别可分为特定人语言识别和任意人语言识别．又可分为孤立音节、孤立单词识别和连续语言识别．广义的语言识别，还包括说话人识别．说话人识别又分两类，一类是说话人确认，即在已存有的某说话人资料的基础上，根据申请人的要求，确认申请者的发音与所存的资料是否同一个人．另一类是说话人鉴别，是根据所存的一群人的发音资料，从中找出当前被鉴别的语音材料的发音人．

语言识别的一个目标是实现语音打字，50年代就是以语音打字机来带动这一研究的．除语言识别之外，在充分利用语法、语意的基础上，又发展了语言理解系统．当把高层次的语言合成系统和语言理解系统结合在一起时，又可实现人机语言对话系统．总有一天可以实现人与计算机打交道，不完全只靠键盘输入和打印输出．这对公共场所的许多服务设施，有着特别广阔的应用前景．

这里需要特别加以强调的一点是，语言信号与其它信号不同，它是人类所特有的信号系统，我们除了要了解它的物理特性之外，还必须特别注意它的社会特性．因为，语言是有民族特点和地区差别的．在做语言信息处理时，单靠一般的信号处理技术是不够的，还必须辅之以句法、语意乃至语用分析．

3．3 音乐

音乐和语言一样久远，音乐声学是声学的古老的分支．音乐声学的研究内容包括声乐和器乐两方面．声乐方面也称歌唱声学，主要研究发音的机理，歌声的声学特性．器乐方面主要研究乐律和乐器的声学特性．

音乐上把一个倍频程，如从某一频率为f的纯音到2f频率之间的间隔，称之为一个八度．又把一个八度按频率比为21/12分成12等份，每一等份称为一个半音．每一个半音又分成100音分．两个频率f1，f2相比的音分数按下式来求

音分数=1200log2（f2/f1）

=3986lg（f2/f1）（5.15）

现代乐器制造所用的标准音调是A=440Hz．音分与音阶名称之间的关系见表5.3．

表5.3 音阶名称与音分

音阶名称
音分
音阶名称
音分
音阶名称
音分

同音
0
大三度
400
小六度
800

半音
100
完全四度
500
大六度
900

全音
200
增四度
600
小七度
1000

小三度
300
完全五度
700
大七度

八度
1100

1200

利用现代电子技术和计算机，根据音乐理论和声学数据，也可以实现计算机作曲和电子合成器乐演奏．

3．4 音质与噪声控制

音质是指房间或厅堂内的传声品质．对房间音质有影响的决定性因素是混响、声场分布和噪声．房间是一个封闭空间，声波在房间中传播时碰到边界（墙面、天花板或地板）就会反射．比较光滑坚硬的边界对声波的吸收比较小，因而声波可以反射很多次，这种现象就是混响．从声源发出声音到衰减了60dB，也就是声波的能量只剩下百万分之一，所需的时间称之为混响时间．一个房间要是混响时间太长，在里边说话就听不清楚．因为，前一个声音还没完全消失，下一个声音又到了，二者互相干扰．比如，在大饭厅里听报告，就常如此．混响时间要是太短，听说话自然清楚，可是听音乐就显得发“干”，缺乏余音和活泼感．所以，对不同的使用要求，有着不同的最佳混响时间．混响时间除与房间里面的声吸收有关以外，还与房间的体积有关．在同一个房间里不同频率的声音的混响时间也是不同的．

几种不同用途的房间，其最佳混响时间大致为：播音室0.5s（秒），音乐播音室1.0s，音乐厅1.2s，风琴音乐1.5s（房间容积1000m3，频率500Hz）．房间体积加大，混响时间要加长．人民大会堂的大礼堂有91000m3的体积，空场时500Hz的混响时间约为2.4s．

一个房间里的声场分布要尽量均匀，否则有的地方声音大，有的地方声音小，音质也不好．除了经过特殊设计的歌剧院和音乐厅，大多数房间或厅堂，为了取得较好的声场分布，都借助于适当的运用电声系统，来改善房间的音质．

噪声的广义的定义，是任何不需要的声音．当大气中存在对人们的生活、工作和健康有危害的噪声时，便形成了噪声污染．

有时也以噪声源的频谱特性来分类，如：白噪声便是一种频谱连续而且均匀的噪声，粉红噪声则是频谱连续但振幅随频率升高而有规律降低的噪声．

噪声可造成一系列危害．非常强的噪声（160dB以上），不仅可以损坏建筑物，也使发声体本身因疲劳而破坏．这种声致疲劳对火箭发射，飞机航行影响很大．

一般的噪声可使人烦恼，影响工作，妨碍休息和睡眠．噪声级较强或持续时间过长也可能致病，最多见的是致聋．因此，对工作环境和居住环境的噪声大小，各国都有控制标准．现在多数国家采用的标准是每日工作8小时或每周工作40小时，A声级不得超过90dB；住宅区室外容许的噪声基本值A声级35dB～45dB．对不同的时间和地区，对上述标准值可加以修正．

噪声控制的一般方法是尽量降低噪声源的噪声辐射，其次是在噪声的传播路径上采取措施降低噪声的影响．当上述办法仍不能达到满意的效果时，还可以采用一些防护设备，如耳塞、耳罩、头盔等护耳器．

4 超声及其应用

4．1 超声的性质和特点

超声是频率在20000Hz以上的声音，因此人类是听不见的．不过有些动物能够听见较低频段的超声，像蝙蝠、飞蛾、蟋蟀、鼠、鲸鱼、海豚、海豹、海狮等．

从客观上讲，超声和可听声，除频率范围不同外，并没有差异．但超声由于频率高，便具有一些特点，尤其重要的是，这些特点可加以利用，这正是人们所以研究超声规律的原因．

超声的特点之一很简单，就是听不见．前面提到，声音来源于部件的振动．振动除产生声波外，还可以产生其它作用，其中一些作用将在下面介绍．如果我们激发振动的目的是这些其它作用，那么通常我们不想同时产生听得见的声音，因为这些声音这时是噪声．在这种情况下，可以激发20000Hz以上的振动，既能完成一些其它功能，又不伴生干扰．

超声的第二个特点是波长小．任何一种波动（声波、电磁波、等离子波等等）都有一些共同的基本参数，其中之一是传播速度（参见5.2.1），另一个就是波长．声波是机械波，或说是力学波．媒质中有声波传播时，原来是静止的媒质质点会以原占位置为中心作很微小（例如也许只几十纳米）的振动，每个质点在振动若干次后将恢复静止．但这种振动的状态，由于媒质的弹性，会传给紧邻的质点，依次向下传递，可能传得很远，在海洋中甚至可传到1000km以外．这种传递的速度就是声波的传播速度．每个质点振动的幅度，叫位移幅度，位移幅度也是声波的基本参数之一．振动的快慢是另一个参数，单纯振动时叫频率．如前用c表示声速，并设f表示频率，波长λ即由式

确定．对于单一频率的正弦或余弦波，波长是波峰与波峰之间或波谷与波谷之间的空间距离．

超声频率高，因此波长小．这有两点重要后果．一点是不必用尺寸很大的声源，即振动源，就可以产生指向性比较尖锐的声波．定性地说，指向性描述声源所发射声束的狭窄程度，狭窄的象手电筒所发射的光，宽广的或说弥散的可象电灯泡所发射的光．在许多声波应用中，我们需要前者而不需要后者．可以证明，如果要产生前者，声源的尺寸应当比声波的波长大几倍．1MHz的声波在水中的波长约为1.4mm，而1000Hz的声波在水中的波长约为1.4m，制作和搬运一个直径几毫米的声源显然比制作和搬运一个直径几米的声源省事得多．

由于同样的原理，不仅容易实现狭窄的声束，还容易实现声束聚焦，象人们通常聚焦光那样．在焦点或焦区，声强可以很高，从而产生一些强烈的作用．

超声波长小的第二点重要后果是，超声可以被微小的障碍物散射开来．平面声波在传播过程中遇到有限大小的障碍物时会被障碍物所散射，就是说，入射波不再沿原方向传播，而是向四周散开（参见5.2.3），包括散到与入射方向相反的方向．所谓障碍物是指材料的声学参量ρc不同于基质ρ0c的物体，ρ是密度（因此基质内的空穴也是障碍物．）．沿各个方向散开的声波幅度分布，或说散射图案，因障碍物的尺寸与波长之比而异．可以想见，当ρc差别不大时，如果声波波长远大于障碍物的尺寸，声波几乎会忽略障碍物的存在，反之则声波几乎象碰上一个界面，而被反射和折射．如果声波波长接近于障碍物的尺寸，声波的散开程度会较大．在某些声波应用中我们倒希望声波被散开，从而可以通过测量散射图案，判断不透明媒质中有没有障碍物以及是怎样的形状、大小、内含物的障碍物．假若障碍物很大，我们可以采用频率低、波长长的声波，若障碍物很小，我们就需用频率高、波长短的超声．

超声的第三个特点是与物质有相互作用．声波的某些物理的、化学的、生物的效应，或笼统地说，声波与物质的相互作用，只有在高频率范围才会发生．例如有多种类的所谓“弛豫效应”，分别只在不同的高频率范围才能出现．又例如，超声在液体中有一个很突出的物理效应，叫“空化效应”．超声会在液体中产生空穴或气泡，这些气泡处于非稳定状态，在适当条件下会迅速崩溃，从而在气泡内产生几千度的高温，在气泡周围产生近千大气压的激波．高温和强激波的出现则可以导致声致发光、水中声致自由基、机械作用（如粉碎、乳化等等）、化学反应活性加强、高分子解聚等效应．

4．2 超声在医学诊断、无损检测和工业检测中的应用

4．1中提到，超声的一个特点是容易形成细声束，以及可以被相当小的障碍物所散射，其中包括背（逆）向散射．将这束细声束向正前方射出，同时使它上下左右摆动，便可以搜索前方有没有障碍物．用电子学的手段，容易测量反射波或背散射波回转的时间，在已知声速的情况下，可以确定前方障碍物的位置．当障碍物足够大时，从回波随声束移动的分布，可以显示出障碍物的形状；对比较小的障碍物，人们正在寻求判断障碍物的大小、形状、内含物等特征的方法．对于不均匀的透明材料，我们常用光学的办法检测；对于不透明材料，用普通的光学方法是做不到的．而包括超声的声波则能够透入任何媒质，不论这媒质是气体、液体、还是固体，也不论透不透光，对不同媒质的差别只是透入深浅不同．利用超声来检查或显示媒质中是否存在障碍物，以及障碍物有哪些特征，叫做超声检测．

对于超声，障碍物是ρc不同于基质的物体．人的肝脏内如果有个肿块，这肿块的ρc不同于肝脏的ρc，肿块就是超声的障碍物．母体内的胎儿对于羊水中的超声也是障碍物．因此超声检测很自然地用于人体，常称为医学超声诊断．把超声源（超声探头）在人体外表面扫动或在一处转动，使声束在人体内作线扫描或扇形扫描，配合电子学手段，显示出人体内部与声束方向平行的断层内超声图像的方法，就是当今家喻户晓的“B超”，B是相对于A、C、F等一些声束扫描方式而言的．在医学诊断中，应用多普勒效应又可以检测体内血液的流动情况及血管形态的某些异常．

类似的原理和方法可以用于检查金属和非金属材料内部的缺陷，缺陷也是障碍物．材料内部可能有夹杂物、气泡或裂缝．夹杂物、气泡或裂缝的ρc都与材料本身的不同，因此将反射或散射入射的超声．用超声检测材料是工业上广泛采用的无损检测手段之一（无损是说不破坏材料），其它的手段有X光、γ射线、电磁场等等．超声又可类似地用来测量容器内液位的高低等等．

利用超声的某些性质在不同的媒质中，或在同一媒质的不同状态下的差异或变化，主要是声速或衰减度的差异或变化，可以识别或检测不同的媒质或媒质的不同状态，例如可以检测液体混合物的成分变化．用超声手段对媒质的一些非声学量（如成分、粘度、温度、应力等等）进行测量，有时叫超声工业检测．

4．3 超声在加工处理和医学治疗中的应用

利用超声的能量以及超声与物质的相互作用，特别是前面提到的（参见5．4．1）超声空化作用，可以改变物质的一些物理、化学及生物性质或状态，或者加快这些改变过程，简称加工和处理．超声的频率范围宽、产生大能量的设备比较小巧，又不伴生噪声，因此声波的加工和处理应用几乎都在超声范围（声哨除外）．

在工业上，超声大量用于乳化、清洗、粉碎、搪锡、钻孔、雾化、焊接、金属成型等等．近几年来，超声加速化学反应的作用受到关注，声化学逐渐发展为一门新兴的热门分支学科．

超声用于医学治疗已有多年的历史，应用面广泛，近来新报道了治疗偏瘫、面神经麻痹、小儿麻痹后遗症、乳腺炎、乳腺增生症、血肿等等，都有一定的疗效．

4．4 超声电子学器件和系统

声学的实验研究，历史上受到真空电子管发明的极大推进．此后，声学和电子学紧密联系，主要是声学的研究和应用大量利用电子学器件．近几十年来，声学反过来为电子学提供器件，特别是70年代声表面波的新技术兴起之后．运用声波能够制作可用于10MHz～103MHz电信号的延迟线、振荡器、谐振器、带通滤波器、脉冲压缩滤波器、卷积器等等，广泛用在电视、通讯、雷达、电子对抗等方面．把一些器件组合起来，又可以形成具有某些特殊功能的电子学系统．器件和系统大部运用声表面波，也有些运用体声波和磁弹波，有关的研究构成超声电子学．

声波器件之所以能作为电子学器件，是因为产生和接收声波的元件是电声式的．如果把这些元件（超声换能器）也包括在器件中，则有电信号转成声信号，声信号再转成电信号，于是器件的输入和输出都是电信号，构成电子学器件．以声表面波器件为例，波的产生、传播、接收和处理，都可用半导体平面工艺在一小块压电（如铌酸锂、石英）单晶基片上完成．声表面波是在这块压电基片表面浅处传播的声波，它的波形，容易由选择换能器的几何形状和基片上附加的一些结构加以控制和改变．加上声波的波速比电磁波波速小五个数量级的特点，声表面波可以用来制成频率范围适用、性能独特、小型、适时的上述多种电子学器件．

5 声与海洋

5．1 水声学中的基本概念

在人们所熟知的各种辐射形式中，以声波在海水中的传播为最佳．在混浊和含盐的海水中，无论光波或电磁波的衰减都远较声波的衰减为大．

我们在5.2中已介绍过，水声中取具有均方根声压1μPa（微帕），即1×10-6N·m-2（牛顿·米-2）的平面波声强为声强的单位．

海洋及其边界的详细特征对声传播的影响是非常复杂的．声速是温度、深度和盐度的函数．而温度又是深度、季节、地理位置（纬度）和气候条件的函数．海洋表面有时是非常光滑的反射体，有时又是随机散射声波的非常粗糙且扰动的表面，海底的构造、斜度及粗糙度也是变化多端的．所有这些因素都影响声的传播．声束与海面及海底边界相互作用的效果产生了最终的声传播特性．

根据实验结果与理论分析，声速的典型公式如下：

c=1449+4.6T-0.055T2+0.0003T3+（1.39-0.012T）

（S-35）+0.017Z （5.16）

式中c为声速（m·s-1），T为温度（℃），S为盐度，Z为深度（m）．

讨论声速随深度变化的特性时，最好是将海洋划分成如图5-5所示的一系列水平分层，称为声速剖面．

海水的表面层从海面扩展到约150m深度，这一层受局部气候甚至一天中不同时刻的影响很大．在平静的海况下，水温随着表面层的深度而迅速降低，导致了很强的声速负梯度．

表层以下的水温受风暴或瞬变因素的影响很小，但随季节却有很大的变化．此层被称为季节温度跃变层．它延伸到300m左右，并具有负梯度的特征．第三层具有温度负梯度结构，被称为主温跃层．随着深度的增加，温度减小到接近冰点，声速逐渐下降到最小值，在中纬度区，这一深度大约在1000m左右，称为深道轴．最下面一层为等温层．此层中声速随深度而增加，所以是正声速梯度．

我国近海基本上是浅海大陆架．声速剖面图随季节变化更大．一般在冬天是等温层，而到夏天会出现明显的负梯度或负跃层．

1．海洋表面的声损失

在空气和水的分界面，由于阻抗严重不匹配，反射系数近似为-1．当声波波长甚大于波高时，反射声损失基本上为零．

2．海底的反射损失

即使海底是绝对平面，反射过程也相当复杂．入射到海底的声能一部分被传输到海底沉积物中，一部分被反射．据实际测量，对于沙质海底，反射损失约为7dB．

3．海洋中的声吸收

声波在海水中传播时，部分能量以热能的形式耗散掉．我们可以用传播损失TL来刻划由于声吸收带来的传播方面的损失．若用分贝来表示可以写成

TL=20lgr+10lg[exp（br）] （5.17）

其中r为距离，b为指数衰减因子．声吸收的大小与声波的频率有很大关系．

4．海洋噪声

海洋噪声的来源有自然的也有人为的．不同的噪声源呈现不同的方向特性和频谱特性．自然噪声源有地震的扰动，风、雨使海面的搅动和水分子的热运动．各种发声的鱼类也对海洋噪声做出贡献．人为的噪声指的是远处航船产生的噪声．

5．混响

海洋本身和其界面包含着许多不同类型的不均匀性，其尺度小至灰尘那么大的粒子（它使深海成为蓝色），大至海水中的鱼群和海底的峰峦与海底山脉．这些不均匀性形成媒质物理性质上的不连续性，因而就阻挡照射到它们上面的一部分声能，并把这部分声能再辐射回去．这种现象称为散射．来自所有散射体的散射成分的总和称作混响．

如果往水下扔一颗手榴弹，那么在炸药爆炸之后，我们还会听到一阵长的，慢慢变弱的颤动的声响，这就是混响．

5．2 射线理论与简正波理论

在5.2中我们已给出了描述理想均匀媒质中平面波和球面波传播的方程．实际上，影响声在海洋中传播的因素在三维空间中是变化的．同样也可随时间变化．在水声学中，特别重要的还是随深度的变化．从声速剖面来看，海洋好象是被分层的．从水和空气的分界面开始，到海底的各种沉积层为止．

波动方程的一般形式就是式（5.11）给出的偏微分方程．这个方程的解是与初始条件和边界条件有关的．有两种方法可以解这个方程．

一种是简正波理论．它用称为简正波的特征函数来描述声传播．每一特征函数都是波动方程的一个解．把简正波叠加起来，以满足边界条件和源条件，其结果就是一个复杂的数学函数．虽然它适于在计算机上进行数值计算，但在直观上不容易理解声源能量在时间与空间上的分布．简正波理论比较适于描述浅海中的声传播．

波动方程的另一种解法是射线理论．它的出发点是声波在传播过程中存在波阵面．从声源发出的声能沿着射线传到空间各处．射线声学有很大的直观的优点，它用声线图给出传播的图像．它的缺点是不能给出波动方程的精确的解．

由于波动方程求解十分复杂，超出本书的范围，我们在此不详谈．

5．3 声呐声呐方程

声呐（Sonar）一词是第二次世界大战期间由声音（Sound）、导航（Navigation）和测距（Rang-ing）三个英文单词的字头构成的．它是利用声波判断海洋中物体的存在、位置及类型的设备．在军事上，它是海军的重要电子设备．在民用方面，又是海洋开发不可缺少的手段．

图5-6给出了一个基本的声呐系统的模型．它有两种工作方式．第一种称为主动声呐．由发射换能器把电信号变为声信号，在水下发射出去．当它照射到一个目标时，反射信号或称“回波”就被接收换能器收到，再变换为电信号送给接收机．第二种称为被动声呐，目标由于它所辐射的噪声而被发现．

对于工程应用来说，声呐方程是用于设计声呐与对声呐性能作出预估的最有力的工具．它把与声呐设计有关的各种参数以等号的形式联系在一起．正确地在各种参数之间作出选择就可能设计出适合各种特殊用途的声呐设备来．

在声呐方程中，出现的参数可以分为三类．

1．由声呐系统决定的参数：

SL：发射时的指标声压，即离发射换能器1m处所接收到的声压．

GS：声呐系统的空间增益．它是由多个换能器布阵而取得的．用于发射系统时，也用DI来表示．

GT：声呐系统的时间增益．它是由信号处理系统在时间上的积累而取得的．

DT：检测阈，它表示声呐员判断有目标时所必需的最小输出信噪比．

2．由目标决定的参数：

SL：辐射噪声源的指标声压级（即离辐射源1m处所接收到的声压），又称为声源强度．

TS：目标强度，表示目标截获声能并将它重新辐射出去的能力．

3．由环境决定的参数：

NL：背景噪声级，它可以仅仅由自然噪声构成，也可能由自然噪声加混响和舰艇的自噪声构成．

TL：传播损失，表示在水声信道中从1m处到某一距离的传播损失．

我们先介绍主动声呐方程．设指标声压为SL．当它传输到距发射换能器为r的目标时，变为SL-TL．由于目标强度为TS，所以当信号重新被辐射出来时，声压为SL-TL+TS．经过同样的传播损失，在到达接收水听器时，成为SL-2TL+TS-NL，加上增益GS及GT应等于最小可检测信噪比，即

SL-2TL+TS-NL+GS+GT=DT （5.18）

再来讨论被动声呐方程．假定目标辐射噪声的指标声压为SL．经过距离为r的衰减变为SL-TL．水听器所接收到的应是SL-TL-NL．经接收机处理之后获得增益GS+GT，于是

SL-NL-TL+GS+GT=DT （5.19）

声呐方程可以方便地用于计算声呐的作用距离．

5．4 海洋开发中的水声学

人类赖以生存的地球，海洋占表面积的70%．开发和利用海洋是人类生产、生活的重要活动．据估计，海底石油、天然气的储量约占地球总蕴藏量的50%左右．大洋洋底分布的锰结核约有15000亿吨．海洋每年大约可以为人类提供30亿吨食物．海洋中大约有80种化学元素．大洋的变化又是地球气候变化的重要因素．

几乎每一项开发海洋的工程活动都或多或少地与水声学有关．

1．海洋环境参数测量

（1）波浪测量

波浪运动所产生的功率与浪高及其周期有关．功率近似表达式为

P≈0.55H2T （5.20）

单位为kW·m-1（千瓦·米-1），H为浪高（m），T为波浪周期．

用波浪的能量可以发电．我们可以用定点浪高仪来测量波浪高度的变化规律，为开发潮汐能提供原始依据．定点浪高仪是一种简单的主动声呐，利用声波到达海面时的全反射来记录浪高．

（2）海流测量

大洋环流的流速比较稳定．利用海流计可以测量海洋中的流速及流向，根据所测得的数据绘制大洋流速、流向图，是航海家不可缺少的资料．比较先进的海流计是利用多普勒效应进行测速的系统．它不仅可以测量大洋表面的海流还可以测量海流剖面．

（3）海中声速测量

声速是海水作为水媒质的一个重要参数．海洋中声速剖面图是海军舰只活动的必备资料．因为无论是攻击敌方还是保存自己，都必须利用声速剖面图来规划自己的航行细节和声呐使用技巧．

目前比较普遍使用的声速测量仪是一种可以和微机联结的声学探头．当把探头由海面放下去之后，即可将经过的路径中的温度、盐度与深度数据采集记录下来．由微机中的专用软件换算出声速并提供声速剖面．

（4）大洋测温

地球上的一些灾害性天气（如厄尔尼诺现象）或环境变化（如二氧化碳增多，臭氧层的空洞等）都会引起大洋温度的微小变化．利用声波在大洋中长距离（几千公里）的传播可以把温度的微小变化测量出来．1991年开始，美国、加拿大等国已在实施这一计划．我国也从1995年开始参加．预定在夏威夷岛爆炸小型炸弹，在世界各地接收声信号来推算大洋温度的变化．

2．海底地形、地貌及地质勘探

（1）回声测深

回声测深仪是一种高频窄波束的主动声呐．目前各大洋都已被广泛地进行测量，并绘制了海底等深线图．

（2）海底地形、地貌仪

这是一种多波束主动声呐，用于绘制海底的地形、地貌．为海底电缆、输油管的敷设提供依据．

（3）近海油气田勘探

声学数字地震勘探技术是近海油气田勘探的主要手段．世界上比较著名的英国北海油田就是用这种方法发现的．它主要利用一种拖曳式线列阵声呐，用人工在海下制造小地震的方法，记录局部海区的地貌，借以判断有无油气田．我们从北到南的近海地区正在开展这类勘探．

3．导航及其它应用

海上船只的导航、巨轮的靠岸都需要不同类型的声呐．此外海难救助也要利用“声发”声道．随着人类向海洋进军的广度及深度的不断提高，水声学在海洋开发中的作用也会越来越大。

6 声信号的数字处理

6．1 信号处理的基本概念

在我们日常生活中，声波是听觉信号的载体，而视频信号则是图像信息的载体．人类大脑在接收到声信号和视觉信号之后要进行一系列的处理，有些处理是非常复杂的．如语言的识别、理解、联想，图像的分类、识别等．

信号的产生、存贮、传输、加工等是信息论中的重要课题．我们统称为信号处理．声信号是一种特殊信号．由于它所牵涉到的频率相对来说比较低，同时只是时间的一维函数．所以信号处理的理论和技术首先是从声信号处理这一领域发展起来的．特别是与语言和音乐信号有关的这一部分信号处理理论，长期以来一直成为信号处理的主体．60年代末开始，由于数字信号处理技术的出现，研究工作者才逐步地把一维信号处理理论与技术逐步地向二维推广．同时又由于技术的进步，使我们不仅能处理频率较低的声信号，也有可能处理频率高得多的图像信号．

从理论上说，我们可以把声信号看作是时间t的函数x（t）．信号处理可以被认为是对x（t）进行的各种运算，这种运算可以是线性的，也可以是非线性的．最基本的信号处理手段有以下几种．

1．滤波

把x（t）经过一个滤波器，使它的频率特性发生某种变化．这种滤波也可以只是幅度的增大或缩小，也可能只是时间的延迟．

2．谱分析

x（t）的傅里叶变换X（f）称为x（t）的谱．它反映的是x（t）在频率域上的特性．

图5-7给出了一些简单信号的频谱．对信号进行频谱分析可以使我们知道特定信号的频率范围．

3．信号的传输

信号的传输是人类信息交流的不可缺少的需求．要使信号不失真地从一处传到另一处是一件不容易的事．最典型的例子便是电话．我们总感到从电话里传来的声音与真实的声音有一定差异，这主要是在声音传播之前已经有了一定的畸变的结果．

4．信号的存贮

要把信号按原样保存起来，又能随时不失真地重放，这是录音的基本要求．要完全做到这一点还有一定困难．

5．信号的加工

包括对信号作各种变换（压缩、扩展）及对信号的检测处理等．

信号处理的理论已渗透到很多领域，信号处理的技术也已在很多工程部门得到应用．整个信息产业是现代国家的支柱产业之一，有信息就要有信号处理理论和技术．美国从1991年开始，把IEEE中原名为“声学、语言、信号处理”的协会改名为“信号处理”协会．我国也已成立了信号处理协会．专业工作者遍及国民经济和国防科研的各部门及高等院校和科研机关．

6．2 声信号的数字处理

从60年代开始，由于微电子技术和数字计算机技术的迅速发展，信号的数字处理得到极快的发展．因为数字化有一些非常突出的优点，它便于加工、存贮、传输．一些传统的用于模拟信号的运算也可以移植到数字处理中去．在数字信号处理技术发展的初期，由于硬件方面的限制，它的应用还受到一定的限制．到了80年代，由于微处理机及大规模集成电路专用数字信号处理（DSP）芯片的出现，使数字信号处理技术一日千里地向前发展．现在数字化的革命几乎已在各电子领域展开．高级音响、彩电、个人手持终端、无胶片照相机、无磁带应答电话等都已在或正在准备使用数字技术．据估计到20世纪末，数字化电子产品的产值将达到3万亿美元．这是一个非常惊人的数字．

信号的数字化的简单概念如图5-8所示．我们首先要把模拟信号在时间和幅度上进行量化．时间上的量化称为采样，幅度上的量化称为分层．

采样频率越高，分层数越多，数字化的信号就越能逼近原来的模拟信号．当然硬件上也就越复杂．

奈奎斯特采样定理指出，如果信号是带宽有限的，那么只需要用大于或等于带宽两倍的采样频率进行采样，所得的样本就可以恢复原始的信号．这个定理的重要意义在于给出了一个确定采样频率的标准．举例来说，目前电话数字传输系统的采样频率是8kHz，语音信号在采样之前，先经过一个上限频率为3.4kHz的低通滤波器．所以采样基本上不产生失真．对于分层来说却不存在类似的结果．无论多么细的分层都会带来信号的损失．可以把幅度的量化看作是某种量化噪声．所以比特数太小的分层会带来严重的畸变．一般声信号处理采用的是14bit～16bit（比特）的分层．

数字化之后的信号已变为0、1序列．这是非常易于处理、加工、传输、存贮的信号．并且在一定的误码率范围内还可以进行校正．这些都是模拟信号无法比拟的．目前已发展了一套数字滤波、存贮、加工及传输的技术，并且已专门设计了用数字信号处理的芯片．这种芯片不象微处理器那样采用冯·诺伊曼结构，而是采用并行处理的哈佛结构，克服了数据流中的瓶颈，使效率大为增加．图5-9是DSP芯片的原理结构图．

目前，用于声信号和图像信号处理的专用DSP芯片的指令周期已在50ns左右，每秒钟可以完成数千万次浮点运算．

6．3 声学与现代数字信号处理技术

现代数字信号处理技术把声学带到了更多的应用领域．它大大地丰富了人们的日常生活，同时使微机、通讯、消费电子产品等行业互相联系．声信号处理自身的发展和进步又反过来推动数字信号处理技术的发展，使DSP技术呈现出更加美好的前景．其中特别引人注目的是人机对话、机器翻译．我们简略介绍这些应用领域．

1．高级音响

传统的模拟信号磁带式录音机，动态范围小（一般为40dB左右），频带窄（200Hz～8000Hz左右），因而音质较差．另外，这种磁带的节目搜索是非常麻烦的，而且也不易保存，复制的次数多了，质量就差了．现代的数字式录音机的采样频率为44.1kHz，因此，对输入信号的频响可扩展到20kHz左右，量化比特数一般在212以上．动态范围高达60dB以上．

目前市场上出售的CD唱机是一种光盘系统．有5in（英寸）盘和3in盘两种．节目的搜索很简单．最新的一种3inCD唱机不仅可以放音也可以录音，完全可代替老式的模拟音响．

2．多媒体计算机

现代计算机已从单纯数值计算发展为多种用途．近年来发展最快的一个领域是多媒体技术．即一台计算机除了保持原有的科学计算、文字处理等功能之外，还可以用于声信号、图像信号的处理．例如可以放CD唱片，可以放光盘录像电视，可以作为Fax机接收或发送传真，又可以用于电话应答．总之，是一台多种用途的多媒体计算机．

3．语音识别，机器翻译

由机器识别人类的语言，由机器在不同语种中进行翻译．这是科学家梦寐以求的事情．随着现代科学的发展，这一梦想正逐步变为现实．首先取得突破的是机器翻译．在理解的基础上，可实现不同语种之间的翻译．目前，英日语科学论文的翻译系统的准确率已达到80%．中、英文词组、短语之间的翻译准确率已可达90%．

在语言识别方面．有限词汇、认人的单呼口令的识别已取得很大进展．连呼口令的识别也已有了突破．专家们普遍认为，汉语是最有希望首先实现机器识别的语种．因为汉语的发音是以单字音节为基础的．同音字一共才1200多个（包括四声）．所以只要加强基础研究，找出人类理解语言的机理，就有可能率先在汉语识别中作出重大突破．到那时，人们可以一边讲话，另一边由计算机把所讲的话打印出来．

人工合成语言方面也在取得进展．这一工作开始于本世纪30年代．但是直到50年代才找到了较好的传输线模型来人工模拟人类发声机理，合成出具有一定质量的语言来．目前人工合成语言的主要问题是可懂度及与自然语言的差别．这一方面还有很长的一段路可走．

4．在医学方面的应用

数字式的超声医疗诊断设备正越来越广泛地用于实际的诊断．这一方面最突出的例子是彩色B超和多普勒血流计．这是一种多基元的超声发射及接收设备，可以把人的内脏以很高的清晰度显示出来，为医生诊断提供有力的辅助手段．

5．通讯

电话信号的数字传输已被广泛采用，特别是由于光纤的使用，使数字传输以很快的速度取代老式的电话传输线路．数字采样用8kHz，8bit，电话信号的通频带为3.4kHz．在传输时，一般以24路为一个群，一次群频率为1.544Mbit·s-1，一根光纤的传输率可高达1000M，也就是大约可容纳15000路电话．目前我国已开通自武汉至北京，北京至哈尔滨等多条光纤传输线路．

http://mengyungs.host10.tfidc.com/1dxwl/d4pgx/sx.htm

法律语言学研究网之“学海泛舟”
2009-12-20