无忧商务网,免费信息发布推广平台,您可以 [登陆后台] 或 [免费注册] 无忧商务网 | 企业黄页 | 产品库存 | 供求信息 | 最新报价 | 企业资讯 | 展会信息
黄页信息| 库存信息| 技术服务| 供应信息| 求购信息| 二手信息| 加工信息| 供求库| 报价库| 展会库| 代理信息| 保健| 生活黄页| 食谱| 网络黄页| 水族休闲| 人力HR| 招聘
首页>>生活网>>生活保健>>3C小百科-消费性电子-其他
采用DSP内核技术进行语音压缩开发

 随着仪器仪表人机界面越来越趋于人性化,语音识别的需求不断增长,语音处理技术发展迅速,各种处理算法层出不穷,为大容量的语音应用提供了愈加灵活的技术手段。然而,语音数据的压缩比越高,数据回放算法所要求的计算能力也越强。目前,大多数高压缩比的语音压缩数据生成必须采用专用的语音开发工具和开发版权,这给国内的小规模用户造成了一定的困难。在8K的采样速率下,同样是使用4兆位的flash芯片来存储数据,不同的语音算法所能提供的回放时间有很大差异。例如,采用ADPCM(自适应增量脉冲编码)算法只可提供128秒的回放时间,而采用TI的LPC(线性预测编码)算法却可得到50分钟的回放时间。在某一工程项目中,我们需要开发一种回放时间长达200分钟的低成本手持语音设备,由于使用了DSP内核芯片,在较短的时间内完成了开发工作,达到了预先提出的性能指标。
<P>       <STRONG>1 语音算法与芯片特点</STRONG></P>
<P>       在本项目中,我们选择了DSP集团的语音压缩最新算法Triple Rate Coder,其压缩比达到了46:1,且音质良好,MOS指标达到了3.98。</P>
<P>       该算法的基本思想是:首先将语音分为若干小段,由于语音信号的谱变化是一个缓变量,因此在每一小段内信号是平稳变化的。然后用一个数字滤波器和一个激励函数来表示这一段时域波形的离散采样序列。在实际算法中是采用了一个十阶的线性预测滤波器,计算时还将每一帧分为4个子帧,每一子帧的滤波器系数矢量由上一帧和本帧数据计算得到,而最后一子帧的滤波器系数矢量则由矢量分解预测法得到;激励函数采用的是伪随机多脉冲激励函数,由最大似然算法得到。对每一帧计算得到滤波器系数矢量和函数生成元后,将这些系数再压缩打包就得到了最后的语音压缩数据。当对语音压缩数据进行解压时,首先将打包的数据展开,然后建立起线性预测滤波器,将重新生成的伪随机多脉冲激励函数输入滤波器,这样在滤波器的输出端就可得到被恢复的语音信号序列了。</P>
<P>                                      <IMG style="WIDTH: 190px; HEIGHT: 142px" height=142 alt=d6571原理框图 hspace=0 src="http://www.dzdqw.com/jishu/UploadFiles_9637/200610/20061010223151699.jpg" width=190 border=0></P>
<P>       该算法的实时运算需要22MIPS以上的运算速度,为此DSP集团将DSP内核和算法代码集成在D6571系列芯片内,以满足除PC用户以外的更广泛应用。D6571原理框图如图1所示,其本身可直接外挂并管理4兆位的flash,8K采样速率时在2.8KB的数据率下可提供25分钟的回放时间。该芯片具备工业标准的编解码器接口,可直接与串行PCM接口的音频编解码芯片相连,如美国国家半导体的TP3054或韩国三星半导体的KS8620。D6571可外接两片音频编解码芯片,上电后可用设置命令对外接音频编解码芯片的工作模式进行设置。例如:设置外接芯片的时钟是外同步还是自同步;设置外接芯片处于输出方式还是输入方式等。</P>
<P>       根据实际开发经验,我们认为D6571芯片与其它公司所提供的某些DSP内核芯片相比,其最大的优点是几乎不需要任何开发工具或软件就可使用。因为该芯片的数据是双向的,既可由上位机将压缩后的语音数据通过它解压转变成语音,也可输入语音通过它进行实时压缩后传送给上位机。这就大大方便了长回放时间语音开发用户的使用。更何况目前许多语音压缩芯片对语音数据的管理是不公开的,例如:某些数字录音电话的语音压缩芯片。</P>
<P>       <STRONG>2 系统构成</STRONG></P>
<P>       与语音处理有关的系统构成如图2所示。</P>
<P>                     <IMG style="WIDTH: 289px; HEIGHT: 185px" height=185 alt=语音处理有关的系统构成 hspace=0 src="http://www.dzdqw.com/jishu/UploadFiles_9637/200610/20061010223151226.jpg" width=289 border=0></P>
<P>       语音数据存放在一片32兆位的flash中,采用三星的K29W3200,这是一种8位并行接口的闪存,并行接口有利于提高代码效率和满足实时性要求。</P>
<P>       在语音数据的压缩和回放过程中,D6571和flash之间的数据吞吐均通过上位机进行。上位机采用89C52。系统还有64&#215;64的点阵液晶模块ACM6464等外围设备。所有的设备均使用一条公共的8位数据总线,即CPU的P0口;P2口的六根口线用于键盘管理;P3口的两根口线作为两条串口线;这样用于外设管理的口线还剩余16根可用。系统实际使用了其中的14根线:与flash管理有关的使用6根,与D6571有关的使用4根,还有4根用于液晶显示管理。</P>
<P>       音频编解码接口芯片采用一片TP3054,TP3054工作所需的同步脉冲、采样时钟、数据信号等只需要与D6571的四根控制线相连即可得到。</P>
相关资讯
类别浏览
安徽 北京 福建 甘肃 广东 广西 贵州 海南 河北 河南 黑龙江 湖北 湖南 吉林 江苏 宁夏 青海 山东 山西 陕西 上海 四川 天津 新疆 西藏 云南 浙江 重庆 辽宁 江西 内蒙古
无忧商务网 版权所有 Copyright © 2020.6 www.cn5135.com All Rights Reserved. 湘ICP备12008603号
本站所有产品都是会员自行发布,所有信息都有对方的企业名片和联系方式,如果您需要咨询产品具体参数和细节,请直接联系和咨询厂商,谢谢。
行业子站: 机械 库存 建材 物流 礼品 能源 农业 汽摩 食品 通讯 五金 玩具 矿产 印刷 休闲 服务 服装 化工 环保 电子 纺织 电工 电脑 电器 办公 安全 包装 仪器 家居