如何将句子转换为类别?

Boo*_*oom 0 python keras tensorflow

我正在研究 NLP 问题。目标列包含 5 种类型的句子:

"Extremely Positive", "Positive", "Neutral", "Negative", "Extremely Negative"
Run Code Online (Sandbox Code Playgroud)

我想将这些句子转换为数字 [5,4,3,2,1]。

是否有内置keraspython功能可以这样做?或者我需要使用字典自己转换它?

小智 5

您可能想使用 sklearn 库中的编码器。

LabelEncoder 可用于将分类数据转换为整数:

    from sklearn.preprocessing import LabelEncoder
    label_encoder = LabelEncoder()
    x = ['Positive', 'Neutral', 'Positive', 'Negative']
    encoded = label_encoder.fit_transform(x)
    print(encoded)

    array([0, 1, 0, 2])
Run Code Online (Sandbox Code Playgroud)