阿里巴巴智能音响-天猫精灵X1

阿里巴巴智能音响-天猫精灵X1


由阿里巴巴人工智能实验室在7月5日正式发布的旗下首款智能语音设备,因其内置AliGenie中文人机交流系统,所以理解中文语音指令都是小菜一碟!智能家居控制、个人生活助手、语音购物等都不在话下。它不止有一个极其软萌的名字——天猫精灵X1,还有美丽的价格——499元。

发布会上,天猫精灵X1以它强大的中文语音识别能力震惊全场,其采用的六麦克风收音阵列技术,让在噪音环境下识别出有用信息更容易实现,并且最远语音交互距离可达5米。AliGenie系统还赋予天猫精灵机器学习算法,经过一段时间的使用会适应用户的个人语言习惯,可谓越用越好用~

基于这样成熟的中文语音识别技术,作为阿里巴巴第一代智能语音终端,天猫精灵X1现在已经能够通过语音指令直接实现家居控制、影音内容播放,还能做你的工作秘书、专属天气预报员、大百科问答等。有了天猫精灵,下班回家再也不用满屋子乱窜去开灯、电视和空调,只要一声命令,天猫精灵X1就能帮你实现同步开启;剧荒这种问题也不必再担心,天猫精灵X1根据你的指令给你提供一系列选择,还有播放记忆功能,接着之前的剧情继续播放;就算家有调皮任性的孩子,小家伙可以让天猫精灵做他的百科全书,也可以给他讲个睡前故事唱个小曲儿伴他入睡,光是想想就觉得生活变得更加美好有没有!

除了这些基础操作,对于忘性大星人来说,天猫精灵X1还能通过指令直接呼叫你的手机,再也不怕东翻西找找不到手机~同时还能充当你的减肥、健身管家,报备给你每样食物的热量、告诉你每一个健身动作的要领。这些功能都通过像Keep、虾米音乐、阿里通信这样的第三方应用实现,基于阿里巴巴的智能语音交互平台AliGenie,天猫精灵X1在未来也将源源不断吸收新功能、新应用,以达到向用户提供更加完善的生活服务。

近几年,人工智能几个字一直不绝于耳,在势不可挡的发展浪潮下,从下棋到无人驾驶都让我们见识到人工智能的厉害,但是真正能够为民所用的智能产品却是少之又少。语音交互作为当前大热的人工智能风口,已经实现了技术的高成熟度并走向市场,相信不久之后,会有更多像天猫精灵X1这样的“普惠型”人工智能产品为人所用,让我们的生活更加便利。

1. “天猫精灵X1”基本上是一台小电脑,采用联发科的处理器和专门的声音运算芯片。虽然我觉得阿里旗下所有产品应该统一品牌,但可能是因为部门差异,AI系统命名为AliGenie,而不是从属于阿里已有的操作系统品牌YunOS。在成功激活后,你和音箱之间的每个对话都会被记录到手机客户端里。

2. 开始第一次配置,系统预置音是较为甜美的女声,和后面的合成音差别很大。其实可以人为地把预置声音也改为合成音,减少不协调感。另外,引导录像的男声把我吓了一跳,是字正腔圆的播音腔,这样会让人以为只能用这么标准的话才能让精灵听懂。应该考虑改用普通人来演示。

3. 唤醒词“天猫精灵”(第一次配置时说“你好天猫”)不够友好,因为每次说一句话都必须念唤醒词,还不能太含糊,这跟无缝与人交互的感觉就很不协调了。相比之下“Alexa”和“若琪”都在默认唤醒词上做了一定的功夫;而最佳策略绝对是自定义唤醒词,我就知道有人把Echo音箱命名为“傻*”然后每天欢快的喊“嘿,傻*,给我开窗帘”这样。

4. 我们处于一个比较空旷的办公室,多人说话会很嘈杂和有回声,此时天猫精灵的识别效果很差,经常听不见或者慢半拍。慢半拍的表现是我们喊“天猫精灵”之后的下一句话说到一半,它先是“我在,你说”,然后马上默认你没说话,停止响应。拾音技术阿里选择采用第三方思必驰的技术,但6个麦克风仍不能使其效果达到完美。

根据官方介绍,天猫精灵的使用场景定位为“家庭”,大多数的功能也是围绕家庭用户来进行开发和设计的。由于提高降噪能力的同时,成本也会随之上涨,经过大量实验后这款产品的环境噪音适应程度设定为符合普遍家庭噪音情况的75dB。如果在低噪音、低回音、小面积的家庭场景下,产品的识别效果更好,同时保证了产品成本不高于绝大多数消费者的购买力。

5. 在线购物有很多问题。首先是推荐,因为不支持上下文,很难在说出商品名后,紧接着再让它继续推荐下面的,就等于它只能推荐搜索结果页上第一个结果。很显然,这对其他的商品和我们继续采购的意愿不公平。其次,设置声纹之后,它依然不能顺畅支付,我们的每一次尝试都只是成功加入购物车,而没有前进到支付环节。

官方工程师解释称,我们可以用正确的命令来挑选商品。直接说出品类后系统进行推荐,如果不喜欢可以说“换一个”,这里支持多轮对话;也可以直接说出你想要的商品名称,比如“我要一箱特仑苏”,那么系统会直接推荐这个商品。

而没有立刻下单是因为我们恰好选择的都是不包邮的商品,所以还是必须用户确认,以免发生“误下单”的情况。如果你不在乎邮费,也可以说“我要直接购买”来下单。官方随后会将购买功能的文案修改为“商品不包邮,直接购买还是加入购物车”。

6. 很多它不理解或没听懂的内容,都默认去找了它理解的跟关键字近似的歌曲。而让它闭嘴是个技术活……说句自然点的“关掉这首歌”,它返回“为你开通了单曲循环”。最后只好“静音”,回答“好的,我闭嘴了。”

7. 教唐诗是“天猫精灵X1”的一个演示功能,但输出结果是语音合成的,音调和语速对小孩子其实不太友好。网上有很多现成的朗读版,我觉得可以拿来用。其他资源来自喜马拉雅、优酷或虾米,但可能匹配的还不够好,特别是并非所有优酷土豆视频的伴音都可以播放,也不能听到优酷直播。相比广播电台,其实我更希望听到电视伴音或者听一部肥皂剧。

8. 可以正确识别打车功能,但不能用,估计固件升级后就可以接入滴滴。此外,周边商户推荐的功能也没有开通,我觉得比较好的实现办法是配合手机客户端实现GPS定位,而且接入口碑的结果。

9. 我很想用这个音箱听今天的头条新闻,但效果很差,想要听下来自大大的正能量新闻,这个命令都无法识别,看来还需要加大力量整合UC头条内容。

10. 由于手头没有参与阿里智能阵营的设备,无法测试智能家居功能。估计以后跟京东智能、微信智能、米家的整合将相当艰难,大大限制智能家居功能的应用。