语音助手能像真人打预约电话,谷歌是如何做到的?

  • 2018-10-05 16:58
  • 网易科技报道

(图示:谷歌一直在扩大其智能家居产品线,搭载数字助理Assistant的家用高端音响Home Max售价400美元)

(图示:谷歌工程副总裁尤西·马蒂亚斯(Yossi Matias)指出,“多年来谷歌一直在致力于自然语音技术的研究。”)

  谷歌上周表示,兼容谷歌助理Assistant的家庭互联网设备数量从1月份的1500款增长到现在的5000款。这对于谷歌来说是一项巨大的进步,但不及兼容Alexa设备的一半。目前全球有12000款设备支持亚马逊Alexa。

  谷歌的福克斯一直在试图淡化与亚马逊的竞争。

  “我们很少用竞争的方式来看待它,”福克斯说,“更大的机会是那些还没有使用任何东西的人。”

  尽管如此,两家科技巨头都没有害怕硬碰硬,并且为了智能家居设备的销售而相互出手。今年1月份,谷歌切断了亚马逊Echo和Fire TV访问YouTube的渠道。亚马逊的电商平台也不会出售谷歌以及其收购的智能家庭制造商Nest出品的一些小工具。

  “我们并不知道所有的答案”

  特拉维夫谷歌研发中心负责人马蒂亚斯则表示,谷歌多年来一直致力于开发新的自然语音技术。该公司表示,这不是一种适用于各种电话任务的通用人工智能技术,相反它是为特定任务(比如预约业务)而量身定制的。马蒂亚斯欣然承认,这项技术并不完美,谷歌正在谨慎行事,因为有更多人性化的人工智能会带来更多棘手的问题。

  比如说如果软件开始胡言乱语该怎么办?马蒂亚斯告诉我,技术不会完全失控。他说,当这项功能真正发布时,软件可能会告诉另一端的人正在与数字助理进行对话。当然在我听到的录音中,Assistant并没有这样做。

  马蒂亚斯说:“我们需要仔细考虑如何在实验中进行这种互动。我们相信用透明度做到这一点是正确的。”

  如果对话确实出错,软件将会退回到他所谓的“实时监督培训”。在这种情况下,软件会将对话权转交给人来完成通话。由于对话通常不会受到人的监控,因此他们必须从头开始。 谷歌并没有明确这个人是否会记录此前通话中已经讨论过的内容。

  Duplex技术有些类似于科幻。这就为我们带来了一些既有实际意义,又有哲理的问题:一个人应该如何对待像人一样的人工智能?人类于机器人之间的正确礼仪是什么?在不打断对话的情况下,人工智能在与人交谈时表明自己是机器人的最佳方式是什么?

  当被问到这些问题时,福克斯承认谷歌工作人员正在思考这些事情。

  “我们需要为每个人设定正确的期望,”他说,“这些都是技术实现的问题,我会虚心地说,我们并没有完全知道所有的答案,并且需要根据我们在现实世界中看到的情况来加深理解。”

  现在在斯坦福大学工作的硅谷未来学家保罗·萨弗(Paul Saffo)对这种情况有自己的看法。他说,任何现实人工智能的创造者都有义务向与其交互的任何人透露他们正在与机器对话。

  但是随着这种技术的应用越来越广泛,他认为人们会开始意识到与机器人谈话中的“告知”。萨弗指出:“随着我们的机器不断发展,人们希望自己一开始就知道他们是否正在与机器人交谈。”

  助理无处不在

  尽管目前Duplex技术仍然是一个实验,但谷歌的数字助理Assistant一直在不断发展,有些新功能会即刻上线。

  其中包括更多的发音。Assistant有六个新的男性和女性美语发音,。一个女性的声音柔和舒缓。一个新的男性的声音稍微低沉。

  “我的妻子讨厌那个声音,她说’把它从我的房间里拿走',”福克斯说,他播放的是一个像主持人一样兴高采烈的男性声音。名为WaveNet的技术使声音的扩展库成为可能,该技术大大缩短了录音员录制每种发音所需的时间和音频样本。

  这些发音没有标明特定名称。相反,每个都用一种颜色来指定,如红色,橙色或绿色。您可以通过滑动手机设置来选择所需的一种。当你连接到Google Home时,只需选择您最喜欢的语音设置,扬声器就会识别你的声音,并用所选择的助理发音回复。

  谷歌还调侃说,它也会将歌手约翰·莱金(John Legend)的声音赋予Assistan。

  与大多数更新一样,这个想法是为了让助理更加个性化。 “我们不想强迫人们接受,”一个数字助理听起来本应如此,“福克斯说。

  将于今年夏天发布的另一个更新是叫做Pretty Please的说话模式,其要求你在向助理下命令时要有礼貌。这个模式的目标是鼓励孩子们说“请”和“谢谢”,让孩子更有礼貌。当然对于成年人也是如此。

  亚马逊上个月发布了一项类似的功能,用于为孩子们设计的新一代Echo Dot扬声器。 Alexa的儿童友好型版本提供了正面强化,对一个说“请”回应的孩子,Alexa会回应“谢谢你的问候。”

  在亚马逊发布这项功能时,谷歌表示已经研究Pretty Please有一段时间。 “所有这些都是新生事物,”Assistant产品管理总监莉莲·雷蒙(Lilian Rincon)表示, “我们都在努力解决这些问题,这并不奇怪。”

  还有很多其他新东西:你现在可以一次提出两个问题,Assistant将作出连续回答。 (例如:肯德里克·拉玛多大年纪,他最新专辑的名字是什么?)。你也可以在不说出“嗨谷歌”的情况下提出后续问题,或是重复你的问题。在对话结束之前,麦克风会保持8秒钟的激活状态。在此之前,麦克风在用户提出问题后就暂停拾音。

  开车过程中,Assistant可以在你使用谷歌地图进行导航时向某人发送预定到达时间。当你在手机上访问Assistant时,它会显示更多视觉内容,例如关于最近航班信息和待办事项的提醒。你还可以设置一个“自定义例程”,在关闭早上闹铃后立即触发一组操作。这意味着可以自动开始早间新闻播放,交通状况更新以及最喜欢的歌曲。

  这一切都很有用。但这也意味着谷歌智能助理会更深入地了解用户。

  这值得讨论,因为用户隐私是科技领域讨论的主要话题。自从Facebook于3月份开始与剑桥分析公司(Cambridge Analytica)发生丑闻以来,硅谷大科技企业的数据收集方法在数周内都受到了额外的审查。一家数字咨询公司可以在完全不知情的情况下从多达8700万Facebook用户那里获取个人信息,这种丑闻引发了关于科技巨头如何保护用户数据以及如何赚钱的争论。大多数情况下,谷歌,Facebook和其他公司业务都依赖他们收集的有关用户喜欢什么,不喜欢什么,购物偏好,生活方式等个人信息,以便于营销人员可以投放特定广告。

  谷歌去年的广告销售额达到954亿美元,而Facebook的广告销售额则达到了400亿美元。

  “我们的原则一直是让用户控制这些信息,”福克斯说, “在过去几周时间里强调这一点非常重要,但我们一直都知道这很重要,对我们来说这种强化是有益的。”

  他说,Assistant查询的处理方式与常规搜索查询完全相同,并具有相同的用户设置。这意味着用户可以清除搜索记录,但这可能会影响到所看到的广告。

  所有这一切都是我们讨论Assistant的真正原因。正如皮查伊在2016年提到的那样,这是谷歌搜索的下一次发展,人们花在台式电脑上的时间更少,更多的时间都用在手机和智能扬声器以及汽车等互联网设备上。

  当福克斯被问及他是否认为Assistant现在是谷歌最重要的项目时,他停顿了13秒。

  “Assistant是谷歌一项重要业务,”福克斯说, “做正确的事真的很重要。”(晗冰)

  (原标题:语音助手能像真人打预约电话,谷歌是如何做到的?|用户|助理|谷歌)

头条推荐
图文推荐