导读 使机器能够像人类一样进行交流是开放域对话生成的长期目标。为了实现这一目标,越来越多的对话生成研究关注关键因素——情感。同理心对话系
使机器能够像人类一样进行交流是开放域对话生成的长期目标。为了实现这一目标,越来越多的对话生成研究关注关键因素——情感。同理心对话系统旨在识别用户的情绪和情境,然后生成相应的响应。
这种共情对话系统可以改善用户体验并建立长期的人机交互。然而,现有的共情对话生成模型忽略了相邻对话轮次中各方情感表达的连续性,导致情感感知不足。此外,共情反应涉及的情绪是灵活的,很难设定具体的共情策略。
为了解决这些问题,韩东红领导的研究团队于2024年4月15日在《计算机科学前沿》上发表了他们的研究成果。
该团队提出了一种新颖的共情对话生成模型 ETHREED,该模型依靠分层 GRU 来分别提取和跟踪对话双方的情感表征。此外,该模型通过使用随机策略网络和引导策略搜索来预测响应的情绪表征。实验结果表明,我们的回答具有更好的多样性、同理心和相关性。
在一场对话中,各方的情绪往往是连续的,或者根据上下文转向积极或消极。为了对不同参与方的连续过程进行建模,ETHREED 利用四个 GRU 来获取对话中的全局状态、参与方状态、情感表示和内容表示。
全局 GRU 跟踪所有话语表示以获取上下文信息。参与方 GRU 模拟参与方的交互。情绪GRU分别跟踪各方的情绪。内容 GRU 提取对话内容表示并减轻情绪感知错误。
此外,共情可以看作是当事人之间的情感转移,因此研究将根据说话者的情绪状态预测听者情绪状态的过程定义为共情策略。随机策略网络用于模拟此过程。我们使用听众的真实反应情绪分布作为约束来指导策略搜索。
最后,指生成网络动态地结合预测的听众的情绪表征和上下文信息来解码。
未来的工作可以考虑引入对话行为来指导响应生成并探索更合理的评估指标。