小编can*_*tor的帖子

如何将统计注释(星号或p值)插入matplotlib/seaborn图?

这似乎是一个微不足道的问题,但我一直在寻找一段时间,似乎无法找到答案.它似乎也应该是这些软件包的标准部分.有没有人知道是否有标准的方法在seaborn中的分布图之间包含统计注释?

例如,在两个盒子或者swarmplots之间?

示例:黄色分布与其他分布明显不同(通过wilcoxon  - 我如何在视觉上显示?

statistics matplotlib python-3.x seaborn

26
推荐指数
2
解决办法
1万
查看次数

使用熊猫数据帧的seaborn热图

我正在努力按照pabas中的数据帧按照seaborn的热图(或matplotlib)的正确格式来制作热图.

我当前的数据框(称为data_yule)是:

     Unnamed: 0  SymmetricDivision         test  MutProb      value
3             3                1.0  sackin_yule    0.100  -4.180864
8             8                1.0  sackin_yule    0.050  -9.175349
13           13                1.0  sackin_yule    0.010 -11.408114
18           18                1.0  sackin_yule    0.005 -10.502450
23           23                1.0  sackin_yule    0.001  -8.027475
28           28                0.8  sackin_yule    0.100  -0.722602
33           33                0.8  sackin_yule    0.050  -6.996394
38           38                0.8  sackin_yule    0.010 -10.536340
43           43                0.8  sackin_yule    0.005  -9.544065
48           48                0.8  sackin_yule    0.001  -7.196407
53           53                0.6  sackin_yule    0.100  -0.392256
58           58                0.6  sackin_yule    0.050  -6.621639 …
Run Code Online (Sandbox Code Playgroud)

python matplotlib pandas seaborn

14
推荐指数
1
解决办法
4万
查看次数

python 3 pandas和seaborn使用swarmplot斗争 - multiIndex

我正在努力swarmplot与之合作pandas.我有一个numpy array名为SIAggs 的3D ,我用pandas这样切片:

   rand_center = {('Random_dist'):SIAggs[:,:,1], ('Center_distance'):SIAggs[:,:,0]}

for key, value in rand_center.items():
    rand_center[key] = pd.DataFrame(value)

sizes = {}
for i in range(size_iterations):
    sizes.update({ (str(i+1)) : SIAggs[i,:,:] })
for key, value in sizes.items():
    sizes[key] = pd.DataFrame(value)

df = pd.concat(sizes, rand_center, names = ['sizes', 'distance_measure'])
df.stack()
Run Code Online (Sandbox Code Playgroud)

哪,当我打印DataFrame给我时:

sizes                  1              2              3       
distance_measure       0      1       0      1       0      1
0                -2.1881  1.262 -2.7001  1.493 -2.1381  1.626
1                -2.3671  1.699 -2.4431  1.208 -2.4571 …
Run Code Online (Sandbox Code Playgroud)

python numpy machine-learning pandas seaborn

4
推荐指数
1
解决办法
1174
查看次数

python中的动态数组和速度——增长数组的最快方法

我发现了一些关于这个问题的一般帖子(尤其是列表与数组),但我想知道是否有人知道使用 numpy.append 或重新分配条目是否更快?

具体来说,如果您知道您将拥有一个最大大小为 100 的数组,例如,但不确定最终大小,那么最好:

array_to_mod = np.zeros(100)
for something in loop:
    array_to_mod[something] = new_value
final_array = array_to_mod[0:len(loop)]
Run Code Online (Sandbox Code Playgroud)

其中 loop 是一些你不知道的先验数字,除了它低于 100,或者是类似的东西:

final_array = np.array([])
for something in loop:
    final_array = np.append(final_array, new_value)
Run Code Online (Sandbox Code Playgroud)

想法?

python arrays numpy

2
推荐指数
1
解决办法
2293
查看次数