什么是使用单词本身作为任何机器学习算法中的功能的最佳方法?
我必须从特定段落中提取单词相关功能的问题.我应该使用字典中的索引作为数字特征吗?如果是这样,我将如何规范这些?
一般来说,单词本身如何在NLP中用作特征?
nlp classification machine-learning document-classification
即:"大学","学校"和"学院"属于同一群,"论文","奖学金","钱"等词也属于同一群.这是ML还是NLP问题?
nlp machine-learning
machine-learning ×2
nlp ×2
classification ×1
document-classification ×1