注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

BeyondEgo

Welcome to Winsolider's yard! 超越自我,谁与争锋?

 
 
 

日志

 
 
关于我

本博为记事、畅聊、交友博客,邀你共同探讨人生、探讨成长,广交天下有志之士!愿与有相同兴趣爱好的你,共同学习、一起成长、收获喜悦!

网易考拉推荐

语音识别技术面临的问题  

2011-10-05 16:50:46|  分类: 程序员 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
       凭心而论,语音识别是一项复杂的技术,特别对于汉语语音识别尤其如此。因此,尽管多年前就有众多公司和研究机构开始了语音技术,包括语音识别和语音合成技术的研究,但直到最近一两年,在国内应该说是今年,才开始有规模的商用。 

  国外已经有了不少较大规模的语音识别IVR系统或者呼叫中心的应用,然而在国内,虽然有将语音识别和呼叫中心结合起来的趋势,但仍没有多少应用。这其中虽然有诸多影响因素,但重要的一点就是汉语语音识别技术还不够完善。那么,语音识别技术要进入大规模商用,还要跨越哪些障碍呢? 

  ■用户的独立性 
  所谓用户的独立性,就是语音识别软件能够识别有不同嗓音和口音的用户,而无需通过训练软件来使其识别一个特殊用户的声音。目前的许多语音识别软件,是基于标准的发音来进行识别的。而实际上,人们说话千差万别,发音也各不相同,特别对于有口音的语音来说,更是对语音识别软件提出了严峻的挑战。目前的语音识别软件大部分是通过自学习功能,不断的训练来达到软件对于特定用户语音的识别。 

  将来,语音识别软件的一个发展趋势就是加强处理性,可以识别在一定范围内的各种发音。而实际上,现在有许多语音软件公司在从事这方面的工作,尽量将所有可能的方言发音收入语音库。这样,无需经过专门的特殊训练,软件就能识别用户的发音。 

  ■自然的语言能力 
  许多语音识别系统还具有自然的语言能力,这就是软件理解讲话者的能力。这种能力不仅表现在特定的单词上,甚至还表现在短语和完整的句子上。自然的语言意味着两点:第一,它可让用户用句子来表达意思。例如,为表达checking account,用户可使用有更多单词的自然句子,如I'd like my checking account balance。 第二指用户可使用包含多义词的句子。例如,我们可说I want to transfer $500 dollars from my savings account to my checking account。这是自然语言的一个主要准则,用户可在一个单句中使用多个多义词。 

  有少数复杂的语音识别系统使用提示性对话。在这里,语音识别系统提示用户用一个单词或记号来回答。根据专门机构的调查,多数人更喜欢用约定俗成的自然语言,而不喜欢使用提示性对话。人们讨厌的是不完善的自然语言,当能使用完善的自然语言时,人们当然不可抗拒地选择了它。 

  ■处理插入的能力 
  新增的插入的能力是语音识别软件的另一个主要进步。插入的能力允许用户在系统提示时中断系统,但系统依然能知道用户的请求。 

  这点对于实际的应用来说是有相当意义的。因为人们在说话时,总是在自觉不自觉地思考,经常会在打断语言的连续性,而插入一些补充性的语言。这样的语言,在语法上来说经常不正确的,常规的语音识别系统会很难处理这些语音。 

  ■软件身份验证的能力 
  语音识别销售商最近还介绍了软件身份验证的能力,即根据用户的嗓音和语言特点,来达到识别用户的能力。这在实际中是一个非常有价值的特点,如可用于人事管理上。(
  评论这张
 
阅读(253)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017