苹果研究表明聊天用户喜欢聊天AI助手

2019-09-21 17:54

您如何表征Siri等数字助理的对话风格?不管您的印象如何，合理的理由是打错了语气都可能阻止用户将来使用它。

也许这就是为什么在一篇论文(“ 镜像以建立对数字助理的信任 ”)接受了在奥地利格拉茨举行的Interspeech 2019会议上的原因，苹果公司的研究人员调查了一种对话助手，该助手在响应中考虑了用户偏爱的语调和举止。他们发现，当人们对助手的聊天程度进行镜像时，人们对助手的友善和可信赖度的看法得到了改善，并且可以从这些人的语音模式中提取执行镜像所需的功能。

长期依赖数字助理需要对助理及其功能的信任感。因此，需要建立和维持这种信任的策略，尤其是随着数字助理变得更加先进并在人们生活的更多方面进行操作时，”该论文的合著者写道。“我们假设，一种增强数字助理信任度的有效方法是使助理反映用户查询的对话风格，特别是“个性”的程度，[我们将宽松性定义为查询的程度简洁(信息密度高)与健谈(信息密度低)。”

该小组招募了20名参与者，并让他们完成了一份问卷，旨在评估总体聊天水平和性格。选择进行这项研究的人员填写了一项研究前调查，描述了他们如何使用数字助理，包括使用频率和通常询问他们的问题类型。接下来，在壁挂电视的前面，电视上显示着由人类实验人员精心策划的指令，他们被告知口头要求设置计时器和提醒，获取指示和天气报告，搜索网络等等。

听完对他们的问题的回答后，他们被告知将回答的质量分为“好”，“题外”，“错误信息”，“太不礼貌”。或“太随意”。(对天气问题的一个回答是“应该是74度，晴朗，所以不要打扰穿毛衣或外套，”而另一个则是“ 74度，晴朗”。)在电视前参加了另一轮由实验人员指导的问答活动，但这一次，他们通过聊天，通过麦克风，摄像头和深度传感器捕获语音和面部表情时，对他们进行了评分。

第一次调查的结果表明，大多数参与者(70%)更喜欢聊天者回答而不是简短回答。也许并不奇怪，被确定为健谈的人(60%)更喜欢健谈的互动，而被确定为非闲谈的人(40%)则更喜欢非闲谈的互动。

利用这些数据，研究人员建立了多说话者和说话者无关的分类器，能够将口头命令分类为健谈或非健谈，并确定应优先选择健谈还是非健谈。两者都完全基于音频功能-总共95个声学功能-带有从早期调查响应中提取的标签。

研究小组报告说，这些分类器表现良好，能够将新词归纳为新词，而无需重新摇晃，他们说这是一个有前途的信号，可以可靠地检测出一个人的聊天程度。他们留给未来的工作来检测聊天的范围并扩大参与者池，并折叠视频和深度数据以测量对响应的反应的阳性(或阴性)。

“我们已经证明，当助理反映用户的交谈程度时，用户对数字助理的友好性和可信度的看法会得到改善，并且可以从用户语音中提取实现此镜像所必需的信息……人们能够产生通过行为镜像获得信任和友爱，对话伙伴在协商达成共识的世界模型时会互相反映彼此的互动风格。” 研究后汇报中的轶事证据表明，参与者在镜像条件下更喜欢助手。[我们得出的结论是，各个人和任务域之间的聊天偏好都不同，但是镜像用户聊天会增加数字助理的友善和可信赖度。”

这项工作可能会为改进Siri奠定基础，而Siri 正是苹果公司意识到的局限性。6月份取得了进展，这是神经文本转语音模型的首次亮相，该模型无需使用样本即可发出更自然的声音。在有关预印本服务器Arxiv.org 的最新研究论文中，一个苹果科学家团队描述了一种为Siri的域分类器选择训练数据的方法，该方法仅用一小部分示例就可以大大减少错误。