欢迎来到深圳互联网技术应用协会
您当前的位置:首页 - 协会资讯 - 行业动态

百度开放4项语音技术 吴恩达称或彻底改变人机交互

来源:发布日期:2016/11/23已有 2197 人浏览

百度宣布在其语音开放平台上线三周年之际,向公众开放情感合成、远场方案、唤醒二期技术和长语音方案四项语音技术的接口,并宣布即日起百度将这几项技术免费开放给用户和开发者共享。

百度公司首席科学家吴恩达表示,“这些技术有很大的潜力,去彻底改变人机交互的效率和办法。未来语音技术在很多应用场景有很好的机会,将为人机交互带来巨大的改变。”

根据百度方面介绍,这些技术旨在解决用户在使用语音交互的场合时,普遍感到困扰的一些关键问题。例如,百度情感合成技术主要聚焦在为合成语音“加入情感”,目前可达到接近真人发声效果,百度今年早些时候曾利用此技术,复原已逝明星张国荣的声音。

类似地,开发者还可以利用新的接口,使语音识别距离增加到3-5米,将设备的语音唤醒率提升到95%以上同时更省电误报更少,或提升长时间语音识别的准确率问题。这将为语音技术带来远比现在更多的想象空间,而不只是遥控电视或解锁手机。

据介绍,百度语音开放平台的合作伙伴已涵盖多个领域和场景,包括智能手机领域的联想、中兴;智能家居领域的长虹智能电视、康佳智能电视、SONY智能电视;汽车行业的特斯拉、途胜;智能设备领域的惠普、艾米通讯;智能服务领域的携程等。

百度方面的资料显示,百度语音开放平台自2013年10月上线以来,每日在线语音识别要求从2013年的500万上升到今天的1亿4千万,在线语音合成每日请求达2亿,开发者数量超过14万。在技术指标方面,百度语音识别准确率目前已达97%。

 

地址:深圳市福田区梅华路105号多丽科技楼11层1105A房  本协会主管单位:中国互联网协会 深圳市科技工贸和信息化委员会

深圳市互联网技术应用协会 版权所有 技术支持:九曲网  电话:0755-83352158  QQ:2078864445 邮箱:2078864445@qq.com