人的对话极其庞杂,其中的各词句基于相应的语境和语境。 因此,对话服务需要通过深入理解语言和语境来更有效地学习。
我想买手机,你有什么推荐的吗? 三星很好。 我以前一直用三星。 魅惑是国产手机的十大企业品牌之一,好不好,不试着用一下是不知道的哦。 小米也不错。 小米比大米有营养。 有时严肃,有时看起来荒谬的这些对话,看起来和我们日常微信群里的聊天一样,但其实在这个群里聊天的是机器人。
机器人们能够聚在一起慢慢交谈是一项技术工作,不仅需要将多主体强化学习的做法应用到自然的对话场景中,还需要优化社会交流机器人在不同上下文中的对话策略。 日前,在天津高新技术产业开发区举办的第三届社会交流机器人论坛暨第一届机器人群聊天比赛研讨会上,许多社会交流机器人在同期对话的比赛现场展开了激烈的竞争。
这些机器人说话有点害羞
在这次比赛中,我们发现了试图将多代理机器对话的技术应用于自然的对话场景中。 比赛选择特定主题的启动句,打乱启动顺序,经过单圈或多圈,生成符合主题的流畅对话,最终采用自动评价和人工评价相结合的方法,根据主题的关联性、语言的走向、语境的关联性进行评分。
刚才是认真说话的机器人们,但由于某个机器人的故事突然变了,整个话题有可能被带入了不好意思的故事场景中。 就像那个推荐手机的话题一样,明明说的是手机,但是机器人说的是小米,所以整个话题变成了美食和养生。 组委会委员、哈尔滨工业大学副教授张伟男介绍说,通过这次比赛,机器人们的聊天能力有所提高,但与人际聊天相比还存在一些问题。 多样性低,语言贫乏,恢复重复率高。 一致性弱,在同一个群里说话,机器人前后回复经常会产生矛盾的主题漂移,就是我们常说的脱轨,大部分群里说话后都会脱轨; 质量不稳定、恢复质量差的机器人会严重影响群聊的质量,机器人无法很好地筛选对话历史进行恢复决策。
三种主要技术各有优缺点
虽然让机器人说话看起来很简单,但是必须支撑人工智能交互实现技术的人机对话技术的迅速发展。 获得第一届机器人聊天大会第一名的团队funnlp指导老师、天津大学副教授张鹏在研究中介绍说,大数据和深度学习共同推动了自然语言理解技术的快速发展。 目前,实现人机交互有三个主要技术,各有优缺点。
在基于规则的人机交互系统中,机器人需要基于关键字、if-else条件等系统中预先定义的少许规则进行回复。 这项技术的一大缺点是需要人工制定规则,定义的规则太多了,规则的设计需要很大的努力。
基于检索的人机交互系统直接从预先定义的候选池中选择好的回答,但是不能应对自然语言的多变性、多义性、语境结构、连贯性等,另外,输入消息的语义差异小时,机器人无法识别,而是新的
目前,基于生成模型的人机交互系统是研究热点。 张鹏说,与搜索型对话机器人不同,它可以生成新的回复。 因为这比较灵活。 但是,在这样的系统中有时会发生语法错误,或者生成没有意义的回复。
目前,很难达到人类对话水平
在我们的日常生活中,与各种类型的人的对话随处可见。 微软冰一样的闲谈性对话; 建议进行对话,如任务驱动的多次对话汽车语音系统(如订餐对话系统)等对话呼叫机器人。 其中,闲谈、答疑、基于任务的对话,是在客户输入副本后系统做出恰当的回答,而推荐型系统则积极为客户提供服务和新闻。 但是,由于各种技术还不成熟,这个对话机器人还没有达到人类那样的对话水平,不灵活,有时也会产生一点笑声。
针对此次比赛机器人在群聊恢复中出现的一点问题,张鹏解释说,这是三个原因造成的。 首先,对话机器人在群聊的对话记录、回复的情感完整性以及与其他机器人的交互三个方面存在一定的问题。 因此,群聊中出现了机器人擅自回复、矛盾回复等现象。
其次,训练机器人聊天需要大量的数据,但这次比赛的数字产品和美食主题等特定行业的对话数据相当有限。 另外,这些行业的中文闲谈型对话数据的收集和对话系统的构建非常费时费力。
第三,目前基于神经网络的对话系统依赖大量结构化的外部知识库新闻和对话数据,系统通过训练模仿和学习人类话语,这也造成了回答句的单一问题。 因此,对话服务需要通过深入理解语言和语境来更有效地学习。
像人一样聊天需要深入理解上下文
深度学习技术得到了充分的利用,技术水平得到了提高,但在当前的技术中,让机器人能够像人一样进行聊天还很困难。 张鹏说,人类的对话非常复杂,每一句话都基于相应的语境和语境,朋友们甚至可以在对话中预测对方说话之前下一句要说什么。
要达到与人类对话相当的水平,现在可以研究几种方法。 其一,像基于现在的transformer结构的bert模型和gpt模型那样,是巨大的、高度复杂的结构的ai模型,其参数量达到了数亿个水平。 但是,模型越大,从顾客输入新闻到对话系统反应的时滞就越长,另外,实际上,这种模型仍然需要依赖大量的数据,与人类的思维和学习方法不相符。
二是元学习技术,需要让机器人掌握学习能力,能够根据过去的经验迅速学习。 这样的模型是模拟人类的思维和学习方法,本质上接近人类之间的对话。 但是,我们需要结合具体任务,提出基于物元分析的处理方案,这确实需要更深入的研究。
三是强化学习技术,强化学习系统由主体、状态、奖赏、动作和环境五部分组成。 目前的研究首要任务型对话系统的战略学习中应用强化学习。 强化学习可以解决基于规则的策略所存在的泛化能力低、人工成本高等问题,同时不需要大量的训练资料,只需要一点点的目标就可以提高任务型对话的质量,弥补深度学习的一大缺陷。 当然,强化学习带来了很多挑战,智能体验对当前交互环境有一定的影响等,这些都是我们必须不断探索和深入研究的。
标题:“会说话的机器人纷纷上岗 但让它们好好聊天仍是个技术活”
地址:http://www.clctq.com/news/21609.html