小编Ste*_*ane的帖子

使用 RASA 映射大型数据集的常见问题解答 (2000+)

RASA 由 RASA NLU + Core 组成,我已经测试过我了解它的一些部分。我尝试将其放入示例实践中,并且它的工作完美无缺。

我计划将其提升到一个新的水平,我希望在“tensorflow”后端的帮助下创建一个基于 RASA 堆栈的常见问题解答系统。

我收到了超过 1200 对问题和答案。第一,NLU 将负责理解和分类意图以及实体提取。第二,它将 json 响应传递给 RASA 核心,其中 Answers 将映射或响应给用户。这听起来很简单,但当我去检查 RASA 时,它给出了一些不同的东西。通常,RASA 核心将根据预定义的故事以及 ==> "utter_" 来响应用户。预定义的故事很好,但仅适用于少量数据集。我们必须手动编写它。

当数据集或基于知识的增长如 1000+ 或 5000+ 时如何处理,我们无法手动映射它。我试着环顾四周,但还没有找到任何合适的方法来处理它。

之前我用[Retrieval Model] Sklean Tfidf-vectorizer作为词袋和consine-similary比较并返回最相似的问题索引,当找到索引时Answer会根据索引进行选择,但这种解决方案并不有效因为意义将丢失并且更多的问题。

有没有人有这么好的解决方案?

谢谢

nlp artificial-intelligence chatbot rasa-nlu rasa-core

1
推荐指数
1
解决办法
1010
查看次数