4 r svm text-classification multilabel-classification
我有一个包含两列的数据框.一列包含文本.该列的每一行包含三种不同类别(技能,资格,经验)的某种类型的数据,其他列是它们各自的类标签.
数据帧的快照:

如何从包e1071应用svm.如何将文本数据列转换为某个分数.我想过将文本列转换为文档术语矩阵.他们是其他任何方式吗?如何制作dt矩阵?
您可以使用RTextTools包来创建文档术语矩阵.使用create_matrix函数:
# Create the document term matrix. If column name is v1
dtMatrix <- create_matrix(data["v1"])
Run Code Online (Sandbox Code Playgroud)
然后,您可以使用以下方法训练您的SVM模型:
# Configure the training data
container <- create_container(dtMatrix, data$label, trainSize=1:102, virgin=FALSE)
# train a SVM Model
model <- train_model(container, "SVM", kernel="linear", cost=1)
Run Code Online (Sandbox Code Playgroud)
有关信息,RTextTools用户e1071包内部用于训练模型.
有关更多详细信息,请参阅RTextTools和e1071文档.