如何将句子转换为类别?
我正在研究 NLP 问题。目标列包含 5 种类型的句子:
"Extremely Positive", "Positive", "Neutral", "Negative", "Extremely Negative"
我想将这些句子转换为数字 [5,4,3,2,1]。
是否有内置keras或python功能可以这样做?或者我需要使用字典自己转换它?
回答
您可能想使用 sklearn 库中的编码器。
LabelEncoder 可用于将分类数据转换为整数:
from sklearn.preprocessing import LabelEncoder
label_encoder = LabelEncoder()
x = ['Positive', 'Neutral', 'Positive', 'Negative']
encoded = label_encoder.fit_transform(x)
print(encoded)
array([0, 1, 0, 2])