标签: data-science

找出所有分类变量中的唯一类别

有人可以帮助我使用 python 查找变量中每个不同类别的观察数量吗?为此我用过

df['column name'].value_counts() for single variable.
Run Code Online (Sandbox Code Playgroud)

但我想知道它如何用于数据集中的整个分类变量。

python machine-learning categorical-data data-science

0
推荐指数
1
解决办法
7782
查看次数

如何在 Colab 笔记本上下载 Kaggle 数据集?

有人可以帮我在 Colab Notebook 上下载 Kaggle 数据集吗?我是 Colab 的新手。

dataset data-science

0
推荐指数
1
解决办法
443
查看次数

为什么要标准化朴素贝叶斯后验概率

我想了解为什么需要标准化后验。如果我对朴素贝叶斯定理的理解有误,请纠正我。

在公式

P(B|A) = P(A|B)*P(B) / P(A)

RHS 概率是根据训练数据 P(A|B) 计算的,其中 A 是输入特征,B 是目标类别 P(B) 是所考虑的目标类别的概率,P(A) 是输入特征的概率。

一旦计算出这些先验概率,您就可以获得测试数据,并根据测试数据的输入特征计算目标类概率,即 P(B|A)(我猜这称为后验概率)。

现在,在一些视频中,他们教导说,在此之后,您必须对 P(B|A) 进行归一化以获得该目标类别的概率。

为什么这是必要的。P(B|A) 本身不是目标类别的概率吗?

machine-learning probability naivebayes data-science

0
推荐指数
1
解决办法
840
查看次数

数不。数据帧熊猫中的特定值

我是数据分析方面的新手。我正在尝试使用 python 分析数据集。在此处输入图片说明

  1. 我想数不。幸存列中的 1s
  2. 性别栏的男、女人数

PassengerId Survived Pclass Sex
0 1 0 3 male 1 2 1 1 female 2 3 1 3 male 3 4 1 1 female 4 5 0 3 male

我试过 groupby() 但它给出了错误。

In[88] titanic_data.groupby('Survived') Out[88] <pandas.core.groupby.DataFrameGroupBy object at 0x000000000BFFE588>

请提出解决方案

python numpy pandas data-science

-2
推荐指数
1
解决办法
3376
查看次数

机器学习中的“适合”是什么?

机器学习中的“适合”是什么?我注意到在某些情况下它是培训的同义词。

有人可以用通俗的语言解释一下吗?

machine-learning data-science

-2
推荐指数
1
解决办法
4377
查看次数