我们可以使用 GPT-2 句子嵌入来执行分类任务吗？

Sha*_*ana 5 nlp huggingface-transformers gpt-2

我正在尝试在句子分类任务中使用变压器嵌入，而不对其进行微调。我使用过 BERT 嵌入，这些实验给了我非常好的结果。现在我想使用 GPT-2 嵌入（无需微调）。所以我有两个问题，

我可以像这样使用 GPT-2 嵌入吗（因为我知道 Gpt-2 是从左到右训练的）
除了生成任务之外，GPT-2 在分类任务中是否有任何使用示例？
如果我可以使用 GPT-2embeddings，我应该怎么做？

我基本上解决了问题。这里我使用了从 GPT-2 中提取的嵌入。

所以是的，我们可以使用 GPT-2 嵌入序列的最终标记作为类标记。由于从左到右的自注意力机制，最终的token可以表示顺序信息。
请检查以下 GitHub 问题，了解使用 GPT-2 嵌入的实现。github问题
我进行了实验来比较 GPT-2 嵌入和 RoBERTa 嵌入。我仅使用 RoBERTa 嵌入而不是 GPT-2 获得了更好的结果。

归档时间：	5 年，12 月前
查看次数：	7296 次
最近记录：	5 年，3 月前

使用scikit学习获取最具信息性的功能的问题？ 17

Fasttext .vec和.bin文件之间的区别 16

在python中检测文本中的缩写 7

NLTK - WordNet：长词列表 6

TreeTagger安装成功但无法打开.par文件 5

如何在 spaCy 中正确更新模型？ 5

如何在 HuggingFace Transformers 库中获得预训练 BERT 模型的中间层输出？ 5

使用斯坦福NLP(StanfordNERTagger和StanfordPOSTagger)为西班牙语设置NLTK 4

如何判断两个网页内容是否相似？ 3

如何在NLTK中使用混淆矩阵模块？ 3

如何丢弃Git中的未分级更改？ 4562

如何在单个表达式中合并两个词典？ 4349

Flash CS4拒绝放手 2735

如何在不手动指定编码的情况下在C#中获得字符串的一致字节表示？ 2121

如何避免JSP文件中的Java代码？ 1649

@classmethod和@staticmethod对初学者的意义？ 1532

如何在JavaScript中将十进制转换为十六进制？ 1387

如何在回调中访问正确的`this`？ 1309

在文本框中的Enter键上使用JavaScript触发按钮单击 1250

如何在JavaScript中创建二维数组？ 1081