我是Pandas的新手... 当我不手动指定每个列类型时,我希望以一种简单而通用的方式查找categorical我的DataFrame列,而不是在这个SO问题中.在df与创建:
import pandas as pd
df = pd.read_csv("test.csv", header=None)
Run Code Online (Sandbox Code Playgroud)
例如
0 1 2 3 4
0 1.539240 0.423437 -0.687014 Chicago Safari
1 0.815336 0.913623 1.800160 Boston Safari
2 0.821214 -0.824839 0.483724 New York Safari
Run Code Online (Sandbox Code Playgroud)
.
更新(2018/02/04)这个问题假设数字列不是绝对的,@ Zero 接受的答案解决了这个问题.
小心 - 正如@Sagarkar的评论所指出的那样并非总是如此.难点在于数据类型和分类/序数/标称类型是正交概念,因此它们之间的映射并不简单.@ Jeff的答案如下指定了实现手动映射的精确方式.
我一直在热切地搜索,但找不到答案。
如何使用 sklearn 计算 f 统计量?考虑到以下公式,我真的必须手动计算它吗:
(其中 是观测值的数量, 是变量的数量)。
而且...如果我手动计算,如何获得相关的 p 值?