我有一个序列来训练由spacy的标记化形成的标记的模型.这是编码器和解码器.
输出是来自seq2seq模型的标记流.我想说明文本以形成自然文本.
例:
输入到Seq2Seq:一些文本
Seq2Seq的输出:这不起作用.
spacy中是否有任何API可以反转其tokenizer中规则所做的标记化?
nlp spacy
nlp ×1
spacy ×1