人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。
“我想买手机有什么推荐吗?”“三星的不错,我之前一直用三星的。”“魅族是国产手机十大品牌之一,好不好,用了才知道哦。”“小米也不错。”“小米比大米有营养。”这些看似时而认真,时而无厘头的对话和我们日常微信群聊看似并无二致,但其实在这个群里聊天的都是机器人。
能让机器人们聚在一起好好聊个天可是个技术活,不仅要把多智能体强化学习的方法应用在自然对话场景中,还需要优化社交机器人在不同上下文语境下的谈话策略。在日前天津高新区举行的第三届社交机器人论坛暨首届机器人群聊比赛研讨会上,多个社交机器人在同步对话的比赛现场一较高下。
这群机器人聊天有点“尬”
据了解,本次比赛尝试将多智能体人机对话的技术应用在自然对话场景中。比赛选取特定主题的启动句,打乱启动顺序,经过单轮或者多轮,生成符合主题且流畅的对话,最终采用自动评价和人工评价相结合的方式,根据主题相关性、语言流畅性和语境相关性进行打分。
“刚刚还是一群在认真聊天的机器人,却可能因某一个机器人的话锋一转,整个话题就被带入尬聊场景。就像那个推荐手机的话题,明明是在聊手机,就因为一个机器人说了小米,整个话题就变成了美食和养生。”大赛组委会委员、哈尔滨工业大学副教授张伟男介绍说,通过这次比赛,我们看到机器人们的聊天能力有所增强,但是与真人聊天相比还存在几个问题:多样性程度比较低,语言比较贫乏,回复重复率高;一致性能力弱,同一个群聊下,机器人经常前后回复出现矛盾;主题漂移,就是我们常说的跑题,几乎每个群聊到最后都跑题;质量不稳定,回复质量差的机器人严重影响群聊质量,机器人不能很好地筛选对话历史进行回复决策。
三种主流技术各有优缺点
让机器人群聊看似简单,却都需要人工智能的交互式实现技术——人机对话技术的发展作为支撑。获得首届机器人群聊大赛第一名的队伍FunNLP的指导老师,天津大学副教授张鹏介绍说,在研究上,大数据和深度学习共同推动了自然语言理解技术的发展。目前实现人机对话有三种主流技术,各有优缺点。
基于规则的人机对话系统,机器人需根据系统中预先定义的一些规则来进行回复,例如关键词、if-else条件等。这种技术最大的缺点是需要人工撰写规则,要定义的规则太多,需要付出极大的努力来做规则设计。
基于检索的人机对话系统,直接从预先定义的候选池中选择最佳的答案,但缺点是无法应对自然语言的多变性、多义性、语境结构、连贯性等,且当输入消息的语义差别很小时,机器人便无法精确识别,以至于无法生成新的回复。
“目前基于生成模型的人机对话系统是研究的热点。”张鹏表示,与检索型对话机器人不同的是,它可以生成一种全新的回复,因此相对更为灵活。但是这种系统有时候会出现语法错误,或者生成一些没有意义的回复。
目前还难达人类对话水平
在我们日常生活中,不同类型的人机对话可谓是随处可见:闲聊式对话,如微软小冰;任务驱动的多轮对话,如订餐对话系统等;问答式的对话,如汽车语音系统;推荐式对话,如一些客服机器人。其中闲聊、问答和任务型对话是用户输入内容后系统才会给出相应的回复,而推荐式系统主动向用户提供服务和信息。但由于各项技术尚未成熟,因此对话机器人还达不到类人的对话水平,表现不够灵活,甚至会产生一些笑料。
对于本次比赛的机器人在群聊回复方面出现的一些问题,张鹏解释说,这主要是由三方面原因造成的。首先对话机器人在理解群聊对话记录,回复的情感一致性及与其他机器人的交互三个方面存在一定的问题。所以群聊过程中出现了机器人自顾自回复或者是矛盾性回复等现象。
其次,训练机器人聊天是需要大量数据的,但某些特定领域的对话数据相当有限,如本次比赛中的数码产品和美食主题。并且,这些领域的中文闲聊型对话数据的收集和对话系统的构建都是十分耗费人力的。
第三,目前基于神经网络的对话系统主要依赖于大量结构化的外部知识库信息和对话数据,系统通过训练来“模仿”和“学习”人类说话,这也导致了回复语句单一的问题。因此,对话智能体需要通过对语言和语境的深度理解来更加有效地学习。
像人一样聊天还需深入理解语境
“虽然深度学习技术被充分运用,技术水平有所提高,但是以目前的技术来说,要做到让机器人像人一样聊天还有一定的难度。”张鹏表示,人类的对话是极其复杂的,其中每个语句都建立在对应的语境和上下文的基础上,朋友们在聊天时甚至能在对方说话之前就预料到下一句会说什么。
若想要达到相当于人类对话的水平,目前有几种方法可以探讨。其中一种是构造庞大且高度复杂的AI模型,如现在基于Transformer结构的Bert模型和GPT模型,其参数量已达到数亿级。然而模型越大,从用户输入信息到对话系统反应之间的延时就越长,而且实质上,此类模型仍然需要依赖于大量的数据,这与人类的思考和学习方式不符。
第二种是Meta Learning技术,这种技术需要机器人具备学会学习的能力,能够基于过往的经验快速地学习。这类模型是模拟人的思考与学习方式,从本质上更接近人类间的相互对话。但问题是我们需要结合具体的任务,提出基于Meta Learning的解决方案,这无疑需要更加深入的研究。
第三种是强化学习技术,强化学习系统由智能体、状态、奖赏、动作和环境5部分组成。现在的研究工作主要是将强化学习应用于任务型对话系统的策略学习上,强化学习能解决基于规则策略存在的泛化能力差、人工成本高等问题,并且无需大量的训练语料,只需要一些目标,便能够提高任务型对话的质量,弥补了深度学习的一大缺点,当然强化学习也会带来很多挑战,比如智能体会给当前互动的环境带来一定的影响等,这些都是需要我们去不断探索和深入研究的。
标签:
谷歌浏览器Chrome 100预计明年初发布 可能导致部分网站出现问题
谷歌Chrome是全球第一大浏览器,各种好用就不说了,但是版本号刷新太快了,现在测试版都上99 0了,明年初就要有Crhome 100 0版本问题,三
广东省终端快充行业协会成立大会在深圳举行
广东省终端快充行业协会成立大会在深圳隆重举行。据相关人士分析,该协会的成立将加速推广国内融合快充新技术,过去在终端充电上互不兼容的
湖北省博物馆三期新馆开放 共享曾国考古成果
近日,湖北省博物馆三期新馆建成全面开放。全新亮相的省博,馆舍建筑总面积达11 4万平方米,其中展陈面积达3 6万平方米,在全国省级博物馆
武汉红会医院专家科创工作站成立
近日,武汉市红十字会医院(以下简称红会医院)专家科创工作站调研暨授牌仪式在医院会议室举行。红会医院院长熊念从红会医院总体情况、科协组
小德输官司将无缘今年第一项大满贯赛事澳网
昨天,澳大利亚联邦法院作出裁决,...
2021-2022赛季单板滑雪世界杯U型场地赛结束 蔡雪桐获总冠军
2021-2022赛季单板滑雪世界杯U型场...
比分扳平的机会被浪费 武磊在球队的处境尴尬
昨天,西班牙国王杯1 8决赛,西班...
中国男女国脚都面临着大赛的考验 男足热身平局收场
2022年伊始,中国男女足都面临着大...
把咸菜做出名堂 打响“石扇咸菜”品牌
闻之,十里飘香,清香沁鼻;食之,...
广州市共有8030家登记注册的社会组织 社会团体3467家
1月16日,由广州市社会组织管理局...
广东省建设命名少先队校外实践教育营地(基地)近400个
1月16日,在双减政策落实后首个寒...
徐闻构建三级联动志愿服务体系 让志愿服务成为“家常便饭”
近日,70多名来自湛江徐闻的志愿者...
传统射艺、书画鉴赏......暨大丰富寒假留校学生的生活
搭、举、引、放!话音刚落,一支弓...
传统射艺、书画鉴赏......暨大丰富寒假留校学生的生活
搭、举、引、放!话音刚落,一支弓...
去年广东省法院助力54家民企经破产重整恢复生机
近日,胡润研究院首次发布《胡润中...
粤已完成五大都市圈发展规划编制工作
今年,广东将以更大力度全面构建一...
河源建设宜居宜业乡村 提升城乡融合发展水平
实施乡村振兴战略对于农业大市河源...
中老铁路通车为沿线地区旅游业注入新活力 周边游、康养游现诸多亮点
中老铁路通车以来为沿线地区旅游业...
跨国物流运输方式更新升级 鲜花市场前景一片美好
根据RCEP的内容,进出口企业在与RC...
昆明监督抽检游泳场所80家游泳池水样 6家单位不合格
昆明市卫生健康委员会综合监督执法...
北交所开市迎客 17家为“专精特新”“小巨人”企业
11月15日上午,随着北京金融大街金...
锦好医疗和德瑞锂电成惠州首批登陆北交所的企业
11月15日,随着北京证券交易所(下...
能源与环保专家:“无废城市”建设、乡村振兴是实现“双碳”的两条重要路径
近期,国家相继发布了推进碳达峰、...