在8月10日小米音箱广州品鉴会上,小米电视副总裁高熊勇现场示范一下小米音箱的语音交互,第一句超快反应引起粉丝欢呼,但第二句的沉默则陷入了尴尬。
实际上,今年智能音箱成为互联网巨头们的A I标配,语音交互被认为继按键、触控之后的第三代主流交互。但别说自然语音理解,就是简单的如同品鉴会上的上下文关联也并没有一家A I平台能够实现。
如果语音还在路上,那智能家居该由谁操控?A I平台们相信语音是未来,音箱也不一定是最终载体;硬件厂商则认为遥控器是现阶段最现实的互联方式,红外不需要打破家电厂商之间的隔阂;而更多家电企业更希望激活“化石级”的电视机,用大屏交互更加直观。
出于各自的立场与利益,所谓的“入口”长什么样,“钥匙”怎么开并没有定论。
“百箱大战”争夺A I入场券
从短短半年时间冒出来的近百家智能音箱玩家可以看出,音箱被视为最有可能成为智能家居入口的产品形态。
“对所有的公司,包括像我们这种以语音交互为核心的公司而言,智能音箱都是一个战略性的产品”,出门问问创始人李志飞称,“虽然智能音箱的体量提升、技术成熟都需要时间,但如果我们今天不开始做这个事情,未来4年就算技术成熟、用户有了这个需求,也跟你没有关系。”
李志飞道出了大部分智能音箱参与者的心声,唯恐错过音箱就错过了人工智能的最佳入口。在李志飞看来,“智能音箱市场短时间内达到千万级别的出货量都很困难”,之所以要加入“百箱大战”,在于智能音箱是目前语音交互技术最好的练兵场。
“从技术角度来看,智能音箱就是一个语音交互特别有意思的产品”,李志飞称,“我们在语音交互以及在语音交互硬件的落地上做了很多尝试,手机、智能手表、车载、音箱、耳塞等,发现需要具备几个条件:硬件本身要有黏性、使用空间会比较私密,另外在这个产品上语音交互可能是你最方便的形式,除此之外没有更好的方式。”
但出门问问选择押宝智能音箱的另一部分原因,是从国外的亚马逊、谷歌、苹果、微软到国内的阿里巴巴、京东、搜狗、小米等企业都把赌注押在了音箱上。
“音箱+屏幕”结合
电视企业的曙光
“如果我们想要在语音交互的技术、产品、用户场景上继续迭代的话,今天必须要做提前的布局”,李志飞认为,智能音箱未来或许还需要一款屏幕来配合,“从产品的角度,我一直觉得智能音箱这种1 0 0%靠语音交互的产品是很难做好的。”
“音箱+屏幕”正是智能家居入口争夺战中的另一个流派,包括智能电视企业也试图加入了其中,如暴风T V.
暴风集团创始人冯鑫在极客公园的演讲中认为语音交互技术的兴起也给了互联网电视机新的机会,“以前互联网电视中A PP使用率非常低,基本上就是看视频,但语音唤醒了很多沉睡的A P P,有人让它放音乐,有人购物,突然发现了很多互联网电视机所应该起到的互联网服务开始有了一个入口。”
但对于电视成为家庭人工智能入口的观点,业内大部分持反对态度,反而“音箱+屏幕”的形态被视为人工智能入口的进化阶段。
“大家电更换周期太慢,而且短时间很难实现语音唤醒电视,”亲见H 2开发商数字家圆C E O唐波告诉南都记者,屏很重要,但不是电视机,“一开始是因为语音平台不成熟,误唤醒率高,加入触控屏提高交互效率,但后来发现,基于屏产生的 桌面追剧 与 视频通话 也是用户刚需。”
近场语音交互“遥控器”技术最实际
“遥控器”是智能家居入口中的第三个流派。
“音箱如果能够真的听懂我的话、执行我的话、回复我的问题,那当然是好东西,双手解放了,但现在的技术确实达不到那种阶段,尤其中文太博大精深,同样一句话换个口气都不一样。所以你让它想做的事情越多,越容易出问题”,智能家居方案商B roadL ink创始人兼C E O刘宗孺告诉南都记者,现阶段通过音箱实现远场语音控制还比较困难,B ro a dlink选择从近场语音控制产品切入,由此推出了“魔法棒”。据了解B r o a dlink的核心业务是帮助家电厂商实现智能化,目前平台上已经接入了200多家家电厂商,近期发布的“魔法棒”则是一款控制智能家居产品的“万能遥控器”,消费者可以语音操控魔法棒控制电视、空调、灯,但需要在近距离内。
事实上现在大多智能家居的控制方式是把遥控器挪到了手机上,如小米的米家A PP控制小米旗下的智能产品,智能电视、空调、洗衣机等厂商均开发了自家A P P控制旗下产品,而Broadlink的魔法棒则通过语音操作,取代了手机对于家用电器的控制。
“实际上技术并不难,只要在家电上加入一个通讯模块就行。”优必选C E O周剑则认为,智能家居的关键是厂商之间的互联互通,这是商业上的问题。在其看来,短期内智能家居更有可能通过“遥控器”,但并不是智能的“语音”,而是原始的红外通讯。
痛点
单一入口
还是多个入口?
智能家居入口的形态争论之外,关于智能家居入口会是单一的产品还是多个产品配合也未达成共识。
“在中国做智能音箱,一定不能复制亚马逊Echo的路径”,方糖音箱创始人兼CEO宋少鹏认为中美两地的消费者消费的场景大不相同,“在北美消费者的厨房是开放式的,跟客厅融入一体的厨房,这也是亚马逊Echo最常用的一个使用场景,而与国内的家庭厨房使用场景完全不一样的。”
“从软件的角度来说,我认为入口是统一的”,李志飞称。但硬件的载体是什么、是单一的音箱还是两三个音箱、或者在各处有不同的设备?
“我认为硬件的载体不会是唯一的设备,但我也不同意每一个设备都会有自己远场语音交互的能力。因为成本方面不合理,比如加50元或者100元给空调做远场语音交互就为了控制开关温度”,李志飞称,而如果在面板、花盆、卧室的墙上各贴上模组,保证每个房间里都有远场语音交互是不是有必要呢?
这是从亚马逊、Google等巨头到创业企业都尚未思考清楚的问题。