标签: data-science

找出所有分类变量中的唯一类别

有人可以帮助我使用 python 查找变量中每个不同类别的观察数量吗？为此我用过

df['column name'].value_counts() for single variable.

Run Code Online (Sandbox Code Playgroud)

但我想知道它如何用于数据集中的整个分类变量。

python machine-learning categorical-data data-science

ran*_*ena

2020 01-07

0
推荐指数

1
解决办法

7782
查看次数

如何在 Colab 笔记本上下载 Kaggle 数据集？

有人可以帮我在 Colab Notebook 上下载 Kaggle 数据集吗？我是 Colab 的新手。

dataset data-science

Ank*_* De

2020 05-07

0
推荐指数

1
解决办法

443
查看次数

为什么要标准化朴素贝叶斯后验概率

我想了解为什么需要标准化后验。如果我对朴素贝叶斯定理的理解有误，请纠正我。

在公式

P(B|A) = P(A|B)*P(B) / P(A)

RHS 概率是根据训练数据 P(A|B) 计算的，其中 A 是输入特征，B 是目标类别 P(B) 是所考虑的目标类别的概率，P(A) 是输入特征的概率。

一旦计算出这些先验概率，您就可以获得测试数据，并根据测试数据的输入特征计算目标类概率，即 P(B|A)（我猜这称为后验概率）。

现在，在一些视频中，他们教导说，在此之后，您必须对 P(B|A) 进行归一化以获得该目标类别的概率。

为什么这是必要的。P(B|A) 本身不是目标类别的概率吗？

machine-learning probability naivebayes data-science

Hit*_*ani

2020 09-30

0
推荐指数

1
解决办法

840
查看次数

数不。数据帧熊猫中的特定值

我是数据分析方面的新手。我正在尝试使用 python 分析数据集。

我想数不。幸存列中的 1s
性别栏的男、女人数

PassengerId Survived Pclass Sex 0 1 0 3 male 1 2 1 1 female 2 3 1 3 male 3 4 1 1 female 4 5 0 3 male

我试过 groupby() 但它给出了错误。

In[88] titanic_data.groupby('Survived') Out[88] <pandas.core.groupby.DataFrameGroupBy object at 0x000000000BFFE588>

请提出解决方案

python numpy pandas data-science

Rah*_*ena

2016 07-28

-2
推荐指数

1
解决办法

3376
查看次数

机器学习中的“适合”是什么？

机器学习中的“适合”是什么？我注意到在某些情况下它是培训的同义词。

有人可以用通俗的语言解释一下吗？

machine-learning data-science

作者

lucky-day

-2
推荐指数

1
解决办法

4377
查看次数

如何删除Python pandas索引中的NAN？

谁能告诉我如何删除索引列中的 NAN VALUES

python pandas data-science

作者

2018 10-06

-4
推荐指数

1
解决办法

4007
查看次数

标签统计

data-science ×6

machine-learning ×3

python ×3

pandas ×2

categorical-data ×1

dataset ×1

naivebayes ×1

numpy ×1

probability ×1

找出所有分类变量中的唯一类别

如何在 Colab 笔记本上下载 Kaggle 数据集？

为什么要标准化朴素贝叶斯后验概率

数不。数据帧熊猫中的特定值

机器学习中的“适合”是什么？

如何删除Python pandas索引中的NAN？

标签 统计

标签统计