我阅读有关的n-gram和我想知道是否存在,当实践的情况下,单克会优于使用双克(或更高的n-gram).据我所知,N越大,计算概率和建立向量空间的复杂性就越大.但除此之外,还有其他原因(例如与数据类型有关)吗?
nlp machine-learning data-mining n-gram
data-mining ×1
machine-learning ×1
n-gram ×1
nlp ×1