如何使用 DeepPavlov 进行文本分类

joe*_*oer 4 nlp artificial-intelligence chatbot

我对使用DeepPavlov聊天机器人框架进行文本分类感兴趣。

问题是我没有足够的训练数据。理想情况下,我想对每个类只使用少量样本进行文本分类。

com*_*com 5

您应该查看DeepPavlov 的 autoFAQ 模型。这些模型是专门开发的,在训练数据有限时有效。

您可以使用的型号很少

  • 基于 tf-idf 的模型

  • 快速文本模型

  • 以及两者的混合

更改配置文件中的数据集源并通过运行来训练模型

python -m deeppavlov train tfidf_logreg_en_faq
Run Code Online (Sandbox Code Playgroud)

您可以通过命令行与经过训练的模型进行交互

python -m deeppavlov interact tfidf_logreg_en_faq -d
Run Code Online (Sandbox Code Playgroud)

或通过Python代码

from deeppavlov.core.commands.infer import build_model
faq = build_model("tfidf_logreg_en_faq", load_trained = True, download = True)
a = faq(["I need help"])
a
Run Code Online (Sandbox Code Playgroud)

您可以在Colab 笔记本中找到所有必需的代码片段