自然语言处理中的 Unigram vs Bigram vs Posgram

Aly*_*ono 2 nlp n-gram natural-language-processing

我想知道unigram,bigram和posgram之间的含义和区别是什么。我在互联网上搜索过,但找不到全面的答案。任何帮助将不胜感激。

Eva*_*ata 5

“这是一个例句”

Unigram:一次考虑一个词->“This”或“is”或“an”...

Bigram(或n-gram):考虑n个词的组合(bi -> n=2) -> "This is", "is an", "an example", "example sentence"

Posgram(对这个不太确定):还要考虑词性上下文(例如“名词”“动词”......)以预测更多信息。更正式地说,它减少了所选择内容的维度(减少到从名词集合中挑选一个词,而不是从所有词的更大集合中挑选一个词)。