小编wie*_*eus的帖子

多类分类问题中的不平衡类

我正在尝试使用 TensorFlow 的 DNNClassifier 来解决我的 4 个不同类的多类（softmax）分类问题。我有一个具有以下分布的不平衡数据集：

0 级：14.8%
第一类：35.2%
2 类：27.8%
第 3 类：22.2%

如何weight_column为每个类的 DNNClassifier 分配权重？我知道如何对此进行编码，但我想知道我应该为每个类提供什么值。

machine-learning neural-network deep-learning keras tensorflow

wie*_*eus

2020 11-22

10
推荐指数

2
解决办法

636
查看次数

从多列获取Pandas DataFrame标签索引

我正在弄清楚如何根据列值获取Pandas中的标签索引DataFrame.我有以下内容DataFrame:

d = {'col1': ['label1', 'label2', 'label3'], 
     'col2': ['label2', 'label3', 'label1'], 
     'col3': ['label2', 'label1', 'label3'],
     'col4': ['label3', 'label1', 'label2']}

df = pd.DataFrame(data = d)

Run Code Online (Sandbox Code Playgroud)

格式为:

     col1    col2    col3    col4
0  label1  label2  label2  label3
1  label2  label3  label1  label1
2  label3  label1  label3  label2

Run Code Online (Sandbox Code Playgroud)

我想把它变成以下形式:

       label1 label2 label3
col1      0      1      2
col2      2      0      1
col3      1      0      2
col4      1      2      0

Run Code Online (Sandbox Code Playgroud)

这将告诉原始DataFrame中相应列中每个标签的索引df.例如,col3标签1-3的索引分别是1,0和2.

python dataframe pandas

wie*_*eus

lucky-day

3
推荐指数

1
解决办法

83
查看次数

标签统计

dataframe ×1

deep-learning ×1

keras ×1

machine-learning ×1

neural-network ×1

pandas ×1

python ×1

tensorflow ×1

多类分类问题中的不平衡类

从多列获取Pandas DataFrame标签索引

标签 统计

小编wie_eus的帖子

标签统计