小编pds*_*pds的帖子

检查DataFrame中的哪些列是分类的

我是Pandas的新手... 当我不手动指定每个列类型时,我希望以一种简单而通用的方式查找categorical我的DataFrame列,而不是在这个SO问题中.在df与创建:

import pandas as pd
df = pd.read_csv("test.csv", header=None)
Run Code Online (Sandbox Code Playgroud)

例如

           0         1         2         3        4
0   1.539240  0.423437 -0.687014   Chicago   Safari
1   0.815336  0.913623  1.800160    Boston   Safari
2   0.821214 -0.824839  0.483724  New York   Safari
Run Code Online (Sandbox Code Playgroud)

.

更新(2018/02/04)这个问题假设数字列不是绝对的,@ Zero 接受的答案解决了这个问题.

小心 - 正如@Sagarkar的评论所指出的那样并非总是如此.难点在于数据类型和分类/序数/标称类型是正交概念,因此它们之间的映射并不简单.@ Jeff的答案如下指定了实现手动映射的精确方式.

python pandas

25
推荐指数
7
解决办法
4万
查看次数

在sklearn中计算f统计量

我一直在热切地搜索,但找不到答案。

如何使用 sklearn 计算 f 统计量?考虑到以下公式,我真的必须手动计算它吗:

f-统计公式

(其中 是观测值的数量, 是变量的数量)。

而且...如果我手动计算,如何获得相关的 p 值?

python linear-regression scikit-learn

4
推荐指数
1
解决办法
3119
查看次数

标签 统计

python ×2

linear-regression ×1

pandas ×1

scikit-learn ×1