纽约时间11月10日,CES宣布了2017年度获得创新奖的产品,来自英国创业团队Emotech的语音机器人Olly获得了4项创新奖。虽然入选创新奖的产品数量颇多,但同时揽获CES 4项类别奖,这在CES历史上还是首次。
Olly的外形像是一个坐在垫子上的“甜甜圈”。而颇为奇特的是,Olly与Hover Camera同时位列 “无人机与无人系统”(Drones and Unmanned Systems)的创新奖获得者。
其它项目还包括:
智慧家庭(Smart Home)
家用电器(Home Appliances)
家用音视频组件和配件(Home Audio Video Components and Accessories)
我们对Emotech两位创始人庄宏斌、Chelsea Chen进行了专访,了解了Olly背后的技术、团队和发展脉络。
谁是Olly?
Olly是一款语音机器人,与亚马逊Echo和Google Home定位于普通家庭不同,Olly将自己的用户选择在了都市白领,其核心功能是:提醒、优化日程安排,主打个性化和情感互动。
Olly上半身长得像是一个“甜甜圈”,安装有LED灯;下半身是一个底座,内置6个麦克风。“甜甜圈”与底座之间可以有12种角度变换,甚至可以绕着底座进行360度旋转。Olly约重1.5kg,底座直径约20cm,目前有黑白两种款式。
其实Olly最早样机是出现在2015年 TechCrunch Disrupt大会上,当时它还长这样,像是一个“大眼”喇叭,渐渐迭代至如今的模样。
每一台Olly都有自己的个性
庄宏斌和Chelsea表示,作为一款语音助手机器人,Olly最与众不同的地方在于:它是具有个性的,并且能表达情感。
这意味着Olly会实时习得用户习惯,做出符合用户独特个性的安排和互动。当然,谁愿意让Olly掌握自己的数据,比如日程安排、健身数据等,那么谁就会是Olly的主人。
一旦有了主人,通过对其数据和互动历史的学习,机器人Olly会沾染上主人的性格,变得与主人越来越像。Chelsea说道:
"如果用户是理性严肃的人,那么他的Olly将会以数据导向,直来直去。比如你问今天天气如何,那么就会给你一个多少度、风速多少这样准确的数据。如果主人的个性是感性的,那么他的Olly就会更活泼,在互动的时候会有更丰富的语言发挥。"
Olly会像宠物一样,对不同的人表现出不同的态度。
“一个活泼的Olly,跟主人互动式时会比较俏皮,但如果是陌生人来询问,其表现可能就会跟Echo差不多。”
这样极具个性的机器人,对于主人发出的指令,也会“Say No”,这是Emotech团队颇为自豪的地方。Chelsea举了个例子,当你把自己锻炼身体的计划告诉 Olly 之后,如果有一天你想“偷懒一下”不去锻炼,让Olly打开电视,那么此时它可能会拒绝你的要求,因为它会告诉你,你明天的日程很满,或者明天天气不好,最好的锻炼时间应该是今天。
情感互动:会“Say No”的机器人
其实早期Olly“大眼”设计是有一些争议的,TechCrunch在报道的时候用了“Olly 团队坚持认为这个眼睛很可爱,并非诡异”这样有点戏谑的描述。
Chelsea告诉我们,“大眼”的设计是为了情感互动,让用户能够感受到这个机器人在跟自己对视。但在TechCrunch Disrupt之后,他们做了40多场的用户调查,发现用户对这个设计表现出了两个极端的态度,有的人爱不释手,有的人则会因此感到害怕。而且,新的6个麦克风阵列的设计也需要它们在硬件上作出比较大的改变。
“真正的表达情感不一定非得是用眼睛一直盯着看。”
他们选择了更加抽象的表达方式:通过LED颜色和形状的变化、震动、“甜甜圈”的旋转,来表现Olly的情感。
当你说出“Wake up Olly”唤醒词的时候,本来趴在底座上的“甜甜圈”就会抬起来,用户这时候会感觉自己的机器人“醒来了”。Olly还会用身体的震动来表达开心的情绪。
再比如,Olly的一个典型应用场景就是为你安排健身计划,如果你在 Olly 面前完成了俯卧撑,那么“甜甜圈”就会绕着底座进行 360 度快速旋转,以此表达兴奋之情。
关于竞品: Echo、Google Home 和Jibo
亚马逊的Echo已经卖出了300万台,Google Home也在今年10月正式发售,各巨头、初创公司都在抢滩登陆这个千亿级的市场。
目前Echo和Google Home的售价分别是179和129美元,主要提供信息查询的功能。在Emotech看来,“个性化和情感互动”是Olly相较于这两家巨头产品的优势。
但是Olly并非第一个推出此类功能的语音机器人,它面临着来自美国波士顿的强劲对手Jibo。这款诞生于 MIT 实验室的的产品,拥有豪华的技术团队,既能情感互动,还能人脸识别跟踪拍摄。
但是,庄宏斌认为Jibo想要做的太多,把目标用户定位于家庭成员,难度会非常大。
“如果是定位于所有家庭成员的话,我相信其算法实现和开发的难度是非常高的。单就语音识别这一方面,年龄段不同的语音会差很远,在情感上表达的语义也会差很远。如果一个家庭里有小孩、青年人和老人,那么需要的模型难度是非常高的。而这仅仅是一个例子,我相信Jibo面临的复杂性要比这个高的多,这或许是Jibo一直在推迟发货的原因。”
庄宏斌认为,相较而言,Olly的目标人群会更加集中,就是都市白领,其产品优势就是专注。他们摒弃了屏幕,在功能选择上更加集中,这让Olly快速实现了产品化。庄宏斌告诉雷锋网,预计明年年中的时候英文版的 Olly 就会上市,到明年年底则会推出Olly中文版。
Chelsea告诉我们,目前Olly的定价大约会在“高端智能手机和电脑之间”,也就是说,会比iPhone贵一些,但不及Mac的价格。
Olly的研发时间不到两年
庄宏斌告诉我们,Olly的英文语音识别、语义识别等系统都是他们自己研发的,并没有借助第三方平台。当然,中文语音识别系统与英文还是有很大差别,他们正在考虑中文版的Olly与中国公司的合作。
但Emotech成立不到两年时间,最新版Olly的研发时间也只有半年,他们如何能够做出一款既能完成事务性功能,又能进行情感互动的语音机器人?
关于这个问题,两位创始人认为,这是由于技术团队成员本身有着多年的技术积累,另外就是与英国各高校实验室进行了很多合作。
Emotech目前的技术团队有5名成员,领头人是Pawel Swietojanski,这位毕业于爱丁堡大学的博士,主攻自动语音识别(ASR)领域,另外还有2名成员曾在苹果Siri项目工作过。
在高校合作方面,
“与伦敦大学学院(UCL)主要合作的是机器学习、帝国理工主要是类人脑的AI引擎、爱丁堡大学主要是语言的部分。”
庄宏斌本来就是UCL的学生,得到了来自母校的慷慨帮助。他们与UCL计算机系的负责人John Shawe-Taylor教授合作密切,“所以UCL的众多硕士、博士生都有参与到我们的项目中来”。
另外与他们合作的帝国理工Murray Shanahan教授是AI界的一位明星人物,他所著的《Embodiment and the Inner Life》,探讨了人工智能产生自我意识的问题,对电影《机械姬》导演影响颇大,因此也受邀成为这部电影的科学顾问。
所以,
"Olly是在学校技术人员既有的研究成果之上,不断作出迭代和定制化调整......大半年的时间里,我们做的更多的是对用户的数据采集"。
庄宏斌提及自己当年从人人网离开,到英国留学并创业,就是看中了英国雄厚的人工智能技术积累。
CES的四个奖对于Emotech来说是一个巨大鼓励,Chelsea反复提到“兴奋”这个词。
300多万台的Echo销量已经证明了市场对于智能语音机器人的需求,不过Olly“个性与情感互动”的产品特色对用户来说有多大的吸引力,值得他们多花4、5千块钱去买,这要看市场验证了。对标高端用户,苹果做到了,大疆做到了,获了4个CES创新奖的Olly能否做到,我们拭目以待。