电话网、广播电视网、数据网三网合一是21世纪通信领域发展的必然趋势。人们已逐渐认识到,无论是传统的语音通信还是现代数据通信,最后都有可能走到统一的IP协议上来。IP电话中的语音质量是制约其广泛应用的一个瓶颈,尤其是语音抖动现象的存在,更制约了IP电话在人们生活、工作中的应用,本文对IP电话中的语音抖动问题进行了分析,并初步提出了一个分析解决方案。
1通话过程中语音质量分析
1.1IP电话中出现的语音质量问题
在IP网络上传送话音,影响传送质量的因素主要有分组延时、分组丢失和抖动。
分组延时的定义是以秒为单位的由主机A在链路上开始向主机B发送1b信息,到主机B接收到该信息之间的时间差。换句话说,分组延时直接对应于从第一个用户开始谈话到第二个用户(听者)听到第一个音节之间的时间差。
分组丢失是指从主机A发送的,但不能到达主机B(目的地)的分组数占所发送的所有分组数的百分比。网络上分组丢失的百分比可能明显地影响IP网络上话音的质量。语音本是连续的信号,在将分组数据从主机A发送到主机B的过程中,由于分组传输路径不同,每个路径的长短和数据流量各不相同,造成了分组到达接受端的时间有所不同,这样在接受端回放的语音变得时断时连,这种现象称为话音抖动。
1.2解决技术分析
为解决IP电话中语音的质量问题,主要用以下7种技术进行提高和改善:语音压缩技术、回音消除技术、静噪抑制技术、话音抖动处理技术、话音优先技术、包分割技术和前向纠错技术。这里主要介绍语音抖动处理技术。

在语音抖动处理中主要采用的是抖动缓冲技术,即在接收方设定一个缓冲池,话音包到达时首先进入缓冲池暂存,系统以稳定平缓的速率将话音包从缓冲池中取出、解压、然后播放给受话者。这种缓冲技术可以在一定限度内有效处理话音抖动,提高音质。使用抖动缓冲技术的原理如图1所示:为了确定呼话音包的正确时间间隔,在RTP的包头上提供了一个时间戳(TimeStamp),用于记录这个呼包的产生时间。在发送端,IP网关产生的呼包①的A,B的时间间隔和B,C的时间间隔均为20ms;经过IP网络的传输后,在接收端收到的呼包②的B,C的时间间隔变成了30ms;为了恢复原有的时间间隔,接收端呼网关根据每个呼包的RTP时间戳来确定呼包③的正确时间间隔,把他们恢复成原来的20 ms向下一级设备发送。由于消抖动缓存池不是在接收到每一个话音包的情况下就立即转发,因此还要确定适当的转发延时的大小。如果延时太长,就会使系统整体的延时变得很长;如果延时太短,IP话音包 在允许的时间范围内没有到达,话音仍会出现抖动现象,缓存池的作用不很明显。取两者平衡点的结果通常是使缓存器的网络延时保持在40 ms左右。
2解决语音抖动问题的方案
2.1抖动的处理思路
Internet的实质是分组交换网络,IP分组是存储、转发的最小单元。因此,同一信源的分组可能经过不同的路由传输到接收端,分组到达接收端的时延也不同。这种分组传输时延的不同被称为时延抖动。时延抖动的存在引起收端解码后的语音信号出现间断,造成语音失真,所以必须进行时延抖动的吸收补偿。与分组网传输数据相比,电路交换则是由于预先分配了信道资源,通信子网以流的方式对待数据,即各帧数据从A端到达B端的时间相等,这样也就不存在抖动的问题。在设计IP电话中的语音抖动处理方案时,可以做如下考虑:采用智能缓冲平滑的方法,即让接收端对抖动程度做出预测,并把接收到的信元存放在缓冲器中,采用适当长度的抗抖动缓存,吸收延时后再输出。