语音处理SOC包括:SOC芯片、片上语音处理引擎和应用开发工具等3个主要部分:
SOC芯片采用数模混合的以DSP(Digital Signal Processor)为运算核心的SOC芯片设计方案:处理器采用16bit定点DSP核;内存包括ROM(固化部分语音处理算法)和SRAM两部分;模数通道采用12bit的DAC和ADC,采样率为8KHz/16KHz。
片上语音处理引擎包括:基于音素HMM(Hidden Markov Model, 隐含马尔可夫模型)的汉语非特定人语音识别;基于音素HMM的英语非特定人语音识别;汉语语音合成;基于音素HMM的英语和汉语发音质量评价;5.3kbit/s~24kbit/s的多种码率的语音编码算法;基于自适应滤波器的回声消除;基于维纳滤波的噪声抑制。
应用开发工具:使用该SOC芯片进行产品开发,只需外接Flash存储器、电源、麦克风和扬声器即可完成产品的基础硬件架构。为适应产业化和市场推广的目标,研制了一系列的应用产品开发的软硬件开发工具包。
以数字技术为代表的信息时代,人们会越来越多地通过和各种机器交互来进行信息的获取、处理和传递。人机交互中,当人的眼睛和手被占用时(如驾驶车辆时),或者用眼观察和手操作不方便时(嵌入式产品不断追求轻、薄、小的趋势,使用键盘操作越来越不方便。),应用嘴和耳进行人机交互就更为必要了。在这些应用领域,语音处理SOC技术是突破嵌入式技术和产品发展创新瓶颈的有力武器,应用需求与日俱增。在车载语音处理应用中,仅GPS应用,2003年北美、欧洲和日本,语音人机界面装置共安装了860万台,预计到2010年,三个地区的应用将达到5030万台。嵌入式语音技术在消费类电子产品中的应用主要包括语音拨号、语音控制和语音检索(mp3和mp4)等。据悉,韩国三星公司将于2007年底推出语音检索mp3。在消费类电子产品中应用的关键是在保证性能的前提下降低成本和功耗。教育电子产品也是潜力巨大的市场。美国Auralog公司和Ordinate公司就是专业从事基于语音识别技术的口语教学系统的软件公司。目前在市场上还没有此种类型的嵌入式语言学习产品出现。在我国,只是英语教学机预计市场潜力就有达到1000万台/年以上的需求。
采用本项成果可生产的产品包括:声控(商务/老年人)电话、声控拨号器、声控遥控器、语音检索的mp3/mp4、嵌入式的语音交互幼教(玩具)系统、嵌入式的语音交互的新一代智能语言(英语/汉语)教学机、车载声控语音通信/GPS导航系统、工业交通等用语音记录仪(黑盒子),以及VoIP网络电话机等等极具技术优势和市场竞争力的产品。
希望合作单位提供面上市场需求的应用产品定位及详细描述;针对应用产品立项的资金支持;产品开发(系统集成)的配套人力和物力支持。
联系方式:
清华大学科技处 张虎 联系电话:010-62782239-319 手机:13911625927
联系单位:张家港市科学技术局 邮编:215600
联 系人:许 洁 邮箱:kj.xj@zjg.gov.cn
联系电话:0512-58286127 传真:0512-58286122 |