小编Dre*_*ewH的帖子

删除不是.isin('X')的行

对不起只是进入熊猫,这似乎应该是一个非常直截了当的问题.我如何使用isin('X')删除的行是在列表中X?在RI会写!which(a %in% b).

python filtering pandas

56
推荐指数
4
解决办法
6万
查看次数

我如何在python中进行F测试

如何进行F检验以检查Python中两个向量的方差是否相等?

例如,如果我有

a = [1,2,1,2,1,2,1,2,1,2]
b = [1,3,-1,2,1,5,-1,6,-1,2]
Run Code Online (Sandbox Code Playgroud)

是否有类似的东西

scipy.stats.ttest_ind(a, b)
Run Code Online (Sandbox Code Playgroud)

我发现

sp.stats.f(a, b)
Run Code Online (Sandbox Code Playgroud)

但它似乎与F测试有所不同

python statistics

28
推荐指数
4
解决办法
4万
查看次数

Stargazer Omit测试统计

当使用时stargazer有一个参数,omit.stat但是我需要从我的系数值下面删除测试统计数据,它不是stargazer包文档(PDF)中列出的参数(第14-15页).有谁知道我怎么会这样做?

例如:

install.packages('stargazer'); library(stargazer)
linear.1 <- lm(rating ~ complaints + privileges + learning + raises + critical,
               data=attitude)
linear.2 <- lm(rating ~ complaints + privileges + learning, data=attitude)
attitude$high.rating <- (attitude$rating > 70)
probit.model <- glm(high.rating ~ learning + critical + advance,
                    data=attitude, family = binomial(link = "probit"))

stargazer(linear.1, linear.2, probit.model, title="Regression Results",
          align=TRUE, dep.var.labels=c("Overall Rating","High Rating"),
          covariate.labels=c("Handling of Complaints","No Special Privileges",
          "Opportunity to Learn","Performance-Based Raises","Too Critical",
          "Advancement"), omit.stat=c("LL","ser","f"), no.space=TRUE)
Run Code Online (Sandbox Code Playgroud)

上面给出了一个包含测试统计数据的表格,我想完全省略.以下内容用置信区间替换它们,但这不是更好.

stargazer(linear.1, …
Run Code Online (Sandbox Code Playgroud)

latex r stargazer

5
推荐指数
1
解决办法
3941
查看次数

Pandas groupby连接的groupby对象

我使用groupby和sum快速聚合accros两个数据集

A包含:

sequence shares
1        100
2        200
3        50
1        200
Run Code Online (Sandbox Code Playgroud)

B包含:

sequence shares
1        100
2        200
2        50
3        50
Run Code Online (Sandbox Code Playgroud)

我正在使用A=A.groupby(['sequence']).sum()并对B=B.groupby(['sequence']).sum()每个序列的份额求和.然后我想再次连接这些集合并对序列中的共享进行求和.但是,我尝试使用C = concat([A,B]),现在发现我只有列份额作为索引,不能按顺序分组.C.group(['sequence']).sum()给我一个错误KeyError:你没有名为sequence'的项目.

我想得到的是C:

sequence shares
1        400
2        450
3        100
Run Code Online (Sandbox Code Playgroud)

谁能解释一下这里发生了什么?我可以在groupby().sum()之前连接,但我真的想在连接它们之前将这些数据集缩小到更小的大小.

python pandas

2
推荐指数
1
解决办法
702
查看次数

标签 统计

python ×3

pandas ×2

filtering ×1

latex ×1

r ×1

stargazer ×1

statistics ×1