小编use*_*662的帖子

Pandas Pivot Table手动排序列

对于给定的数据框:

UUT                  testa  testb  testc  testd
DateTime                                
2017-11-21 18:47:29    1.0    1.0    1.0    3.0
2017-11-21 18:47:30    1.0    2.0    1.0    4.0
2017-11-21 18:47:31    1.0    2.0    5.0    2.0
2017-11-21 18:47:32    1.0    2.0    5.0    1.0
2017-11-21 18:47:33    1.0    2.0    5.0    4.0
2017-11-21 18:47:34    1.0    2.0    5.0    1.0
Run Code Online (Sandbox Code Playgroud)

如果我想要以下顺序,我怎么能手动重新排列我想要的列?

testc, testd, testa, testb
Run Code Online (Sandbox Code Playgroud)

因此表格和情节将以这种方式:

UUT                  testc  testd  testa  testb  
DateTime                                         
2017-11-21 18:47:29    1.0    3.0    1.0    1.0  
2017-11-21 18:47:30    1.0    4.0    1.0    2.0  
2017-11-21 18:47:31    5.0    2.0    1.0    2.0  
2017-11-21 18:47:32    5.0    1.0    1.0    2.0  
2017-11-21 …
Run Code Online (Sandbox Code Playgroud)

python sorting pivot-table pandas

9
推荐指数
1
解决办法
2423
查看次数

重采样方法与 scipy.stats.chi2_contigency 的卡方检验 P 值

本题参考《O'Relly Practical Statistics for Data Scientist 2nd Edition》一书第 3 章,卡方检验部分。

本书提供了一个卡方测试用例的示例,其中假设一个网站具有三个不同的标题,由 1000 名访问者运行。结果显示每个标题的点击次数。

观察到的数据如下:

Headline   A    B    C
Click      14   8    12
No-click   986  992  988
Run Code Online (Sandbox Code Playgroud)

期望值的计算公式如下:

Headline   A        B        C
Click      11.13    11.13    11.13
No-click   988.67   988.67   988.67
Run Code Online (Sandbox Code Playgroud)

皮尔逊残差定义为: 皮尔逊残差

表现在的位置:

Headline   A        B        C
Click      0.792    -0.990   0.198
No-click   -0.085   0.106   -0.021
Run Code Online (Sandbox Code Playgroud)

卡方统计量是 Pearson 残差平方和:在此输入图像描述。这是 1.666

到目前为止,一切都很好。现在是重采样部分:

1. Assuming a box of 34 ones and 2966 zeros
2. Shuffle, and take three samples of 1000 and count how …
Run Code Online (Sandbox Code Playgroud)

python chi-squared p-value

5
推荐指数
1
解决办法
725
查看次数

使用特定格式强制pandas xaxis datetime索引

我的pandas数据框看起来像这样:

                      data1   data2         data3
DateTime
....                                       
2016-04-18 16:16:53     -66       1       94.8654
2016-04-18 16:17:03     -67       1       94.8601
2016-04-18 16:17:13     -68       1       94.8410
2016-04-18 16:17:23     -69       1       94.8753
2016-04-18 16:17:33     -70       1       94.8535
2016-04-18 16:17:43     -71       1       94.8529
2016-04-18 16:17:53     -72       1       94.8702
....
Run Code Online (Sandbox Code Playgroud)

我用它绘制后

 plt.style.use('ggplot')
 df.plot(subplots=True, style=style, title='some title', grid=True, x_compat=True)
Run Code Online (Sandbox Code Playgroud)

情节只显示小时数.
1)如何让它显示日期?
2)如何强制它显示我想要的任何格式?

情节

python matplotlib pandas

4
推荐指数
1
解决办法
1236
查看次数

liclipse主题和中间的神秘线

我安装了LiClipse和Darktheme,在源代码窗口的中间有一条奇怪的垂直线我无法摆脱.

事实上,使用pydev和主题应用的eclipse也有这个神秘的线,这是用于什么以及如何将其静音?

什么是线,我该如何摆脱它?

eclipse themes pydev

2
推荐指数
1
解决办法
1139
查看次数

git branch | grep'^ SomeThingInFrontOfLine'无效

我有很多git分支,我想只搜索以某些字母开头的那些

$git branch
 branchA.abc.1234567
 branchA.cbc.1234457
 branchB.cbc.1234457.branchA.backup
 branchC.cbc.1234457.branchA.backup
Run Code Online (Sandbox Code Playgroud)

我想只搜索那些以'brnachA'开头的人

$git branch | grep '^branchA'
Run Code Online (Sandbox Code Playgroud)

但是上面的命令什么都没有,有什么建议?

git bash grep branch

2
推荐指数
1
解决办法
889
查看次数

在 C++ 中包含 vs 在 python 中导入

python中的“import”是否等同于C++中的“include”?

我可以像处理 python 模块名称一样考虑 C++ 中的命名空间吗?

c++ python

2
推荐指数
1
解决办法
2625
查看次数

标签 统计

python ×4

pandas ×2

bash ×1

branch ×1

c++ ×1

chi-squared ×1

eclipse ×1

git ×1

grep ×1

matplotlib ×1

p-value ×1

pivot-table ×1

pydev ×1

sorting ×1

themes ×1