语音识别准确率终于提升了 随时和机器人聊天

2017-06-17 17:14:00 腾讯数码 分享
参与

  [摘要 ]随着语音识别技术准确率的提高,其应用范围也在不断扩大:搜索、购物和发现娱乐内容,对机器说话将很快像对人说话一样司空见惯。

据Forbes网站报道,仅仅在7年前,语音识别技术听起来还是一个笑话。

  在迪士尼乐园等待乘车的一名女性,给她的丈夫发送了一条语音留言:“I got the FastPasses”(我坐上了FastPasses),但显示在她丈夫手机上的信息却成了“In fact, bastard what”(真是混蛋)。

  这是CENT 2009年搜集的Google Voice闹的“笑话”之一,彰显了语音识别技术的巨大进步。

  现代的语音识别技术正在改变人们进行搜索、购物和发现娱乐内容的方式。随着语音助手应用范围不断扩大,对机器说话将很快像对人说话一样司空见惯。

  语音识别无所不在

  在2017年国际消费电子展上,语音技术无所不在。三星在国际消费电子展上展示了新款电视机QLED TV,用户对着遥控说话,即可搜索和播放视频内容。同样在这次展会上,亚马逊Alexa语音助手,几乎出现在所有类型电子产品上。

  准确率的提高,推动了语音识别技术的普及。据国际消费电子展主办方美国消费技术协会高管肖恩·杜布拉奇(Shawn DuBravac)称,语音识别系统的错误率由1995年的43%降低到今年的6%。语音识别技术过去30个月的进步,超过之前的30年。

  语音识别系统理解和处理语言的能力进步很大,微软首席语音科学家黄学东表示,该公司语音识别系统的准确率已经可以媲美人类。

  咨询公司Parks Associates高级研究主管布雷特·萨平顿(Brett Sappington)表示,语音识别系统准确率提高的原因是,它们采用的人工智能技术得到改进。

  不断提升的可用性

  Forbes表示,语音识别技术的目标,是使用户能更便利和自然地使用设备。语音识别技术在QLED TV中的应用就是一个例子。

  三星产品经理Jihyoung Jeong表示,“我们数了下改变亮度需要按键的次数——需要按25次。”

  通过语音命令控制QLED TV要简单得多:用户可以按住Smart Remote遥控器上的麦克风按键,口授命令,释放麦克风按键,电视就会显示并执行命令。

  现在,用户只需简单地告诉电视机“set brightness to 30”(把亮度设定为30),或100之内的任何数值。Jeong表示,对于观看电影和体育比赛节目来说,亮度有很大影响,但“之前,非专家用户不会想到观看不同类型的节目需要改变亮度”。控制音量也有类似的语音命令。

  语音识别技术还使电视机的操纵更为简单。用户无需在屏幕上选择“HDMI 2”等输入类型,只需告诉QLED TV切换到Xbox、Netflix或Spotify即可。

  随着技术的发展,语音识别技术更像是服务员而非设备控制器了。如果在观看电影时听到喜欢的歌曲,用户可以按下语音键,向电视提问“这首歌曲的名字是啥?”答案将显示在屏幕上。如果用户安装有Pandora或Spotify等流媒体音乐应用,可以告诉电视机启动应用,播放听到的歌曲。

  独立设备还是嵌入式系统?

  电视机和亚马逊Echo等智能音箱,能与更多应用和设备相连。语音助手可以订购披萨、报告股价和解释打开照明灯具的语音命令。

  但是,许多语音助手都以独立设备的形式存在,并非所有人都喜欢家里再多加一款电子设备。未来,语音助手可能被嵌入在从冰箱到智能手表在内的传感器所取代。三星计划最终把Bixby语音助手安装到电视机、冰箱、空调和其他家用产品中。用户可以简单地站在空调前,告诉它调低温度,而无需使用其他设备。

  利用语音进行搜索

  目前,大多数人都通过手机认识了语音识别技术。约40%的美国智能手机用户使用语音识别软件。市场研究公司ComScore预测,到2020年,半数互联网搜索将由语音命令启动。

  人们在搜索时通过语音和打字输入关键字存在差异。随着语音搜索增加,这一问题让零售商苦恼。最大的挑战在于,语音输入的搜索关键字包含的单词数量超过打字输入。

  箱包电商eBags首席技术官迈克·弗拉兹尼(Mike Frazzini)表示,“人们在使用语音输入搜索关键字时会说,‘What’s the best luggage set for a three-week vacation in Hawaii’(在夏威夷渡假3周什么行李箱最好?)”,使用打字输入方式,人们不会输入这么长的搜索关键字。”

  这意味着,在处理语音搜索时,设备需要更强大的处理能力,过滤不相干的单词,以提供有用的搜索结果。

  为了向使用语音搜索的客户服务,零售商采用了自然语言处理技术——一种能更精确地解释语言细微差别的人工智能技术。计算机能通过上下文更好地理解信息,理解俚语。

  Forbes称,语音搜索还使企业获得了独特优势:使用语音搜索的客户会披露更多个人信息。把这些信息与网络档案和搜索习惯结合起来,会提高广告和客户服务的针对性。例如,QLED TV会根据用户的观看习惯向用户推荐内容。

  语音识别技术尚存在不足。它有时需要问后续问题才能搞清楚用户需求。通读显示在屏幕上的搜索结果效率更高。

  但是,语音识别系统对用户语音和个人偏好了解越多,它的准确率就越高。由于它在不断进步,因此在帮助我们更好地生活方面有着前所未有的潜力。

  精彩视频推荐

责编:陈健