文献地址:
https://www.aclweb.org/anthology/P17-2079.pdf
主要内容:阿里小蜜对话机器人的介绍,开放域生成式的模型。基于IR和Seq2Seq的综合结果对给出问题的回答。
摘要
基于IR技术和Seq2Seq的综合结果对接近对话问题,并且已经在投入真实使用。
介绍
本论文的对话机器人服务大量的电子商务顾客,为了更好的体验,提供了开放域的对话系统。
常见的QA技术有基于IR和基于生成模型的,其中IR匹配在处理长句上效果不佳,生成模型可能会生成无意义的答案。
所以本论文综合这两种算法来缓解两种算法的问题
生成模型重排策略
当系统收到一个问题之后,会进入两个途径,一个是基于KBQA和IR的匹配系统,另一个是生成模型的回答。如果IR匹配的结果的相似度大于一个阈值T,那么就输出这个结果,否则,就输出Seq2Seq的结果。
这里的生成模型使用的是GRU的Seq2Seq模型,数据是淘宝对话中紧邻的问答对。
上图是IR模型和生成模型的融合形式,当bm25相似度算出来的结果大于0.19的样本使用IR模型的结果,小于的话就使用生成模型的效果。
效果图。
结论
综合IR搜索引擎(这里就是逆排序+BM25)和生成模型的问答。并经过线上测试的考验。