您好,欢迎访问一九零五行业门户网

常用的ITU Speech Codec大全(G.711,G.722.1,G.722.2,G.723.1,G.

总结了常用的itu speech codec,谨供大家学习参考: 1、 g.711: pulse code modulation (pcm) of voice frequencies 编码类型:压扩pcm 编码速率:64kbps 理论延时:处理一个样点的时间(1/8000秒=0.125毫秒); 音质:长途质量; 优点:算法复杂度低,压缩
总结了常用的itu speech codec,谨供大家学习参考:
1、g.711: pulse code modulation (pcm) of voice frequencies
编码类型:压扩pcm
编码速率:64kbps
理论延时:处理一个样点的时间(1/8000秒=0.125毫秒);
音质:长途质量;
优点:算法复杂度低,压缩比小(cd音质>400kbps),编解码延时最短(相对其它技术)
缺点:占用的带宽较高
应用领域:voip,pstn 电话网络
版税方式:free
备注:
     70年代ccitt公布的g.711 64kb/s脉冲编码调制pcm。
     g.711是最基本的一种编码方法,俗称pcm,采用μ-law(主要北美地区使用)和a-law(其它地区)两种非线性量化方法进行压缩。说它“基本”是因为一方面pcm算法非常简单,很多adc硬件的输入输出就直接支持pcm格式;另一方面pcm格式在通信系统中往往需要进一步压缩,因此它是其它语音编码算法的输入源。
2、g.722.1: low-complexity coding at 24 and 32 kbit/s for hands-free operation in systems with low frame loss
编码类型:变换域audio coding
编码速率:24kbps、32kbps;(其实可以实现更多码率,以8kbps递增码率,另外还有32khz采样的更高码率版本);
理论延时:40ms(20ms frame size + 20ms lookhead)
音质:低码率时优于mp3、wma等音频算法,详细可参考polycom网站;
优点:算法复杂度低,小于 5.5wmops,相对于mp3,wma等算法在低码率时音质要好;
缺点:对于speech而言,音质没有celp模型编码器响亮;另外,48kbps以上音质变化不大;
应用领域:电视会议、电话会议和互联网流应用;
版税方式:free
备注:   
      g.722.1是由polycom提出的一套低码率低复杂度的宽带语音编码算法,主要采用了变换域编码方法,因此可以对语音(300~4000hz)和7khz以内的音乐进行编码,采样率为16khz,其32kbps码率的重建语音质量相当于64 kbps g.722 sb-adpcm。在实际的应用中,本算法在低码率时其音质要高于mp3等音频算法,再加上算法低复杂度非常适合嵌入式平台通信、存储应用。最后,它的附录c中提供了32khz采样的14k带宽的音频编码方案,进一步提高了音质。
3、g.722.2: wideband coding of speech at around 16 kbit/s using adaptive multi-rate wideband (amr-wb)
编码类型:acelp
编码速率:6.6kbps~23.85kbps;
理论延时:25ms(20ms frame size + 1/4 subframe size)
音质:高质量相对于窄带语音;
优点:高质量、多码率处理和自适应特性;
缺点:复杂度太高;
应用领域:3gpp 无线通信;
版税方式:单一授权
备注: 
      amr wideband (amr-wb) 是迄今为止唯一的针对无线 (3gpp) 和有线 (itu-t recommendation g.722.2) 应用而标准化的语音编解码器。因此,它也是宽频语音应用的理想编解码器,因为它可以确保聚合有线/无线网络的兼容性。amr-wb 是被 3gpp 采用的唯一宽频语音标准,并且,在具备宽频语音(采样频率 16 khz)支持的情况下,它还是 gsm 和 wcdma 网络中用于宽频语音和多媒体服务的指定编解码器,这些服务包括多媒体信息服务 (mms)、ims 信息和呈现服务、分组交换流媒体业务 (pss)、多媒体广播/组播业务 (mbms) 以及无线一键通业务 (poc)。 其他应用包括 voip、会议、wi-fi 电话、卫星电话、视频电话、互联网流式音频,等等。
4、g.723.1: dual rate speech coder for multimedia communications transmitting at 5.3 and 6.3 kbit/s
编码类型:acelp、mp-mlq
编码速率:5.3kbps、6.3kbps;
理论延时:37.5ms(30ms frame size + 1/4 subframe size)
音质:小于长途质量,mos 3.7;
优点:码率低,带宽要求较小。并达到itu-tg723要求的语音质量,性能稳定,避免了载波信号的时通时断。
缺点:声音质量一般;
应用领域:voip;
版税方式:free
备注:
 g.723.1是一个双速率的语音编码器,是 itu-t建议的应用于低速率多媒体服务中语音或其它音频信号的压缩算法;
其目标应用系统包括h.323、h.324等多媒体通信系统,目前该算法已成为ip电话系统中的必选算法之一;编码器首先对语音信号进行传统电话带宽的滤波(基于g.712),再对语音信号用传统8000-hz速率进行抽样(基于g.711),并变换成16 bit线性pcm码作为该编码器的输入;在解码器中对输出进行逆操作来重构语音信号;高速率编码器使用多脉冲最大似然量化(mp-mlq),低速率编码器使用代数码激励线性预测(acelp)方法,编码器和解码器都必须支持此两种速率,并能够在帧间对两种速率进行转换;
此系统同样能够对音乐和其他音频信号进行压缩和解压缩,但它对语音信号来说是最优的;采用了执行不连续传输的静音压缩,这就意味着在静音期间的比特流中加入了人为的噪声。除了预留带宽之外,这种技术使发信机的调制解调器保持连续工作,并且避免了载波信号的时通时断。
5、g.726: 40, 32, 24, 16 kbit/s adaptive differential pulse code modulation (adpcm)
编码类型:adpcm
编码速率:40kbps、32kbps、24kbps、16kbps;
理论延时:0.125ms(8khz sample rate)
音质:32kbps,长途质量;
优点:计算简单,带宽是g.711的一半而音质接近;
缺点:占有带宽相对还是较高;
应用领域:voip,电话通信网络;
版税方式:free
备注:
     g.726是g.721和g.723的联合,同时增加了16kbps adpcm,但最为常用的方式是 32 kbit/s。g.726是g.711带宽的一半,所以可将网络的可利用空间增加了一倍。g.726具体规定了一个 64 kbpsa-law 或 μ-law pcm 信号是如何被转化为40, 32, 24或16 kbps 的 adpcm 通道的。在这些通道中,24和16 kbps 的通道被用于数字电路倍增设备(dcme)中的语音传输,而40 kbps 通道则被用于 dcme 中的数据解调信号(尤其是4800 kbps 或更高的调制解调器)。
6、g.728: coding of speech at 16 kbit/s using low-delay code excited linear prediction
编码类型:celp
编码速率:16kbps;
理论延时:0.625ms(8khz sample rate)
音质:长途质量;
优点:低延时、抗误码能力非常强;
缺点:比其他的编码器都复杂;
应用领域:ip电话,数字移动通信、卫星通信;
版税方式:free
备注:
    g.728 低延时码激励线性预测编码(ld-celp)是世界上第一个标准化参数语音codec,以celp算法为基础,采用后向自适应线性预测、50阶合成滤波和短激励矢量等改进方法,达到了低延时的目的。
7、g.729: coding of speech at 8 kbit/s using conjugate-structure algebraic-code-excited linear prediction (cs-acelp)
编码类型:cs-celp
编码速率:8kbps;
理论延时:15ms(10ms frame size + 1/2 subframe lookhead)
音质:长途质量;
优点:低码率,高音质,应用广泛;
缺点:算法复杂度较高;
应用领域:voip;
版税方式:free
备注:
      国际电信联盟(itu-t)于1995年11月正式通过了g.729。 itu-t建议g.729也被称作“共轭结构代数码本激励线性预测编码方案”(cs-acelp),它是当前较新的一种语音压缩标准。g.729是由美国、法国、日本和加拿大的几家著名国际电信实体联合开发的。g.729算法采用“共轭结构代数码本激励线性预测编码方案”(cs-acelp)算法。这种算法综合了波形编码和参数编码的优点,以自适应预测编码技术为基础,采用了矢量量化、合成分析和感觉加权等技术。g.729编码器是为低时延应用设计的,它的帧长只有10ms,处理时延也是10ms,再加上5ms的前视,这就使得g.729产生的点到点的时延为25ms,比特率为8 kbps。
96年itu-t又制定了g.729的简化方案g.729a,主要降低了计算的复杂度以便于实时实现,因此目前使用的都是g.729a。
8、g.729.1: g.729-based embedded variable bit-rate coder: an 8-32 kbit/s scalable wideband coder bitstream interoperable with g.729.
编码类型:celp、tdbwe
编码速率:8kbps~32kbps,12个码率;
理论延时:48.9375ms;
音质:未知;
优点:多码率,可与g.729、g.729a和g.729b实现完全操作;
缺点:应用未成熟;
应用领域:voip;
版税方式:有专利
备注: 
g.729.1是一个可与g.729,g.729a 和g.729b 互操作的8-32 kbit/s 可分级宽带语音和音频编解码算法。g.729ev 编解码器输出信号在 8 kbit/s 和12 kbit/s 采样频率上带宽为50-4000 hz,在14-32 kbit/s 采样频率上带宽为50-7000 hz。在8 kbit/s,g.729ev 可以与g.729、g.729 附件a 和g.729 附件b 实现完全互操作。因此可预见在现有基于g.729 的voip 基础设施中将得到有效的部署。编解码器工作于20 ms 帧,算法时延为48.9375 ms。默认情况下,编码器输入和解码器输出信号采样频率为16 khz。编码器生成一个嵌入式码流,它分为12 层结构,分别对应于 8-32 kbit/s 内12 个可用比特率。在解码器端或通信系统任一组成部分都可以将码流截断,从而无需带外信令便可以将比特速率“实时”调整至理想值。
基本算法基于三阶段编码结构:低频带(50-4000 hz)嵌入式码激励线性估计(celp)编解码,高频带(4000-7000 hz)时域带宽扩展(tdbwe)参量编解码,以及通过被称为时域混叠消除(tdac)的估计变换编解码技术实现的全频带增强功能。
参考资料:
1、http://wz.csdn.net/foobarren/
2、http://www.cnblogs.com/huaping-audio/archive/2008/06/19/1224287.html
3、http://kware.blogbus.com/tag/codec/
4、http://www.cppblog.com/gtwdaizi/archive/2008/04/19/41884.html#47591
5、http://www.ctiforum.com/news/2009news/07/news07242.htm
其它类似信息

推荐信息