当前位置: 代码迷 >> 综合 >> 文献记录 - AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine
  详细解决方案

文献记录 - AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine

热度:37   发布时间:2024-02-19 11:43:07.0

文献地址:

https://www.aclweb.org/anthology/P17-2079.pdf

主要内容:阿里小蜜对话机器人的介绍,开放域生成式的模型。基于IR和Seq2Seq的综合结果对给出问题的回答。

摘要

基于IR技术和Seq2Seq的综合结果对接近对话问题,并且已经在投入真实使用。

介绍

本论文的对话机器人服务大量的电子商务顾客,为了更好的体验,提供了开放域的对话系统。

常见的QA技术有基于IR和基于生成模型的,其中IR匹配在处理长句上效果不佳,生成模型可能会生成无意义的答案。

所以本论文综合这两种算法来缓解两种算法的问题

生成模型重排策略

在这里插入图片描述

当系统收到一个问题之后,会进入两个途径,一个是基于KBQA和IR的匹配系统,另一个是生成模型的回答。如果IR匹配的结果的相似度大于一个阈值T,那么就输出这个结果,否则,就输出Seq2Seq的结果。

在这里插入图片描述

这里的生成模型使用的是GRU的Seq2Seq模型,数据是淘宝对话中紧邻的问答对。

在这里插入图片描述

上图是IR模型和生成模型的融合形式,当bm25相似度算出来的结果大于0.19的样本使用IR模型的结果,小于的话就使用生成模型的效果。

在这里插入图片描述

效果图。

结论

综合IR搜索引擎(这里就是逆排序+BM25)和生成模型的问答。并经过线上测试的考验。

  相关解决方案