每个人!我正在阅读有关 Bert 的文章,并想利用其词嵌入进行文本分类。我遇到了这行代码:
pooled_output, sequence_output = self.bert_layer([input_word_ids, input_mask, segment_ids])
Run Code Online (Sandbox Code Playgroud)
进而:
clf_output = sequence_output[:, 0, :]
out = Dense(1, activation='sigmoid')(clf_output)
Run Code Online (Sandbox Code Playgroud)
但我无法理解合并输出的用途。序列输出不是包含了包括['CLS']的词嵌入在内的所有信息吗?如果是这样,为什么我们要汇总输出?
提前致谢!
neural-network python-3.x text-classification tensorflow bert-language-model