手机里的语音技术,你了解吗?
手机嵌入式语音应用介绍
随着人们对各种终端设备智能化程度要求的提高,语音技术正发挥着越来越重要的作用。语音技术的应用就相当于给终端设备装上了嘴巴和耳朵,使得终端设备成为一个能说会道又听话的智能设备。
随着经济的发展,人们生活水平的提高,手机的使用日渐普及,并且人们对手机的娱乐性和智能化要求越来越高,给语音技术在手机上的应用带来了机遇。语音技术的应用将使手机变得更加智能,更加好玩,并且使用更加方便。这无疑会成为手机的一大特色,受到消费者们的喜爱,并且会成为一种流行趋势。
当手机具有语音合成功能时,我们的手机就可以“说话”了。
当有来电时,如果来电号码在我们的通讯录里有,手机就可以播报出来电者的姓名,如果通讯录里没有,手机就可以播报出电话号码。并且,如果预先让手机具有识别区号和手机号所属地区的功能,那么它还可以变得更智能一些,可以播报出是哪个地方的谁来的电话。
当有新的短消息到达时,手机可以为我们读出短信息的内容和来信人的姓名,当然为了保护我们的隐私,也可以设置不让手机自动阅读短消息,在我们让它读的时候它才读,通过一个按键便可以控制。
显然,如果在驾车状态下使用语音智能手机,那么将达到驾车、通讯两不误的效果,并且提高了驾驶的安全性。
另外,我们也可以把闹铃的铃声设置成个性化的语音提醒,例如可以让手机说:“懒虫,起床了”,等所有您想让手机喊您起床时说的话,而且可以天天更换,您所要做得只是输入您想手机说的话的内容,这样,连您起床时都可以不用听老套的闹铃的铃声了,而是听您想听的话。同时,日程表也可以用语音合成读出来,当有日程提醒时,我们不用看手机,就知道该干什么了。
当手机具有识别功能后,我们的手机就变得“听话”了。
当我们需要查找某人的电话号码时,我们再也不用不停地按手机按键来查找了,只需对着手机说出我们要找的人的名字,手机便可以自动帮我们找出要查找的人的所有的电话号码,并且用语音提示您当前所处的是哪个号码。
要打电话吗,同样简单,对着电话喊一下就行了,同时手机还会给您反馈,提醒您拨打的是哪个号码,防止您拨错了可以及时停止操作。另外,还可以用语音的方式实现很多常用的功能,如我们可以对着手机说:打开通讯录,打开收信箱,打开系统设置等等很多命令,手机接收到之后便可以执行相应的命令。这样可以大大节省您进行复杂的按键操作所需要的时间。
目前,市场已经有较多具有语音功能的手机,特别是语音识别方面,已经有很多手机应用了这种功能。而在合成方面则只有比较少数的机型才具有,当然还有一些公司推出了一些既具有合成功能又具有识别功能的智能手机。如磨托罗拉A728,A760,A780等既具有合成功能又具有识别功能,还有很多产品具有识别功能,诺基亚很多产品具有识别功能,三星也推出了多款具有合成功能的手机和具有识别功能的手机。
我们可以预期,随着人们对手机娱乐性和智能化的不断追求,同时在这些大型手机制造商的带领下,语音技术的应用必将成为手机行业的一个应用潮流。
目前,国内提供语音技术的有很多家,其中以安徽中科大讯飞在中文语音技术方面具有的效果。并且在手机上已经有较多的成功应用案例。
据了解,安徽中科大讯飞信息科技有限公司是于1999年6月在国家智能计算机研究开发中心、中国科学技术大学人机语音通信实验室的基础上组建,专注于语音技术的核心研究及其产业化的一家高新技术企业。经过几年的发展,该公司已经成为中国产业化实体中,在语音技术方面基础研究时间长、资产规模、历届评测成绩、专业人才多的公司,并且获得了多项中文语音研究和产业界荣誉,2003年获得“国家科技进步二等奖”和“中国十大杰出青年科技创新奖”,2005年获得05年“国家信息产业重大技术发明奖”奖。
经过多年研究,该公司在以往技术的基础上,于2005年初推出了具有更好的合成效果的嵌入式语音合成软件InterSound 4.0KT。
InterSound 4.0KT语音合成软件是业界小的轻量级中文连续语音合成软件。系统针对有一定处理能力,但资源受到严格限制的嵌入式环境。它在合成效果上更加自然和流畅,已经接近传统大语料库语音合成算法的效果;它集成了智能的文本分析算法,将规则和统计等处理方法进行了有机的结合,具备了较强的分词、多音字识别、姓氏识别、韵律环境预测能力,以及自动识别和处理日期时间、数值金额、电话号码等文本的能力,并能通过添加外部规则的方式,快速增加对新的文本格式的支持能力。按照5分制计算,其合成的自然度可以达到4.2分,可懂度为98%,节奏正确率达到95%。
InterSound 4.0KT在系统架构、代码实现、资源结构等方面进行了大量的研究和优化工作。整体系统架构的设计紧凑高效;系统开发过程中,在合成算法、数据结构、代码编写等不同层面都进行了深入优化;库资源的结构设计也非常精巧,目前的库资源的尺寸已经低于
InterSound 4.0KT系统具有很强的移植性,已经在以下的操作系统下实现移植:Linux,WinCE,Omap,Smartphone,PPC等等,并成功的在Arm、TI、Epson、Philips等硬件平台上实现了移植。Intersound 4.0KT充分考虑了手机的应用环境,满足了在手机的嵌入式环境下的要求,使得实现手机里的语音合成技术已经不再成为困难,并且合成效果将令用户非常满意,增加了手机的个性化特点。
科大讯飞的目标是以的产品、的服务、合适的应用全面推动语音产业的发展,做专业的中文语音应用整体解决方案提供商。