这似乎是一个微不足道的问题,但我一直在寻找一段时间,似乎无法找到答案.它似乎也应该是这些软件包的标准部分.有没有人知道是否有标准的方法在seaborn中的分布图之间包含统计注释?
例如,在两个盒子或者swarmplots之间?
我正在努力按照pabas中的数据帧按照seaborn的热图(或matplotlib)的正确格式来制作热图.
我当前的数据框(称为data_yule)是:
Unnamed: 0 SymmetricDivision test MutProb value
3 3 1.0 sackin_yule 0.100 -4.180864
8 8 1.0 sackin_yule 0.050 -9.175349
13 13 1.0 sackin_yule 0.010 -11.408114
18 18 1.0 sackin_yule 0.005 -10.502450
23 23 1.0 sackin_yule 0.001 -8.027475
28 28 0.8 sackin_yule 0.100 -0.722602
33 33 0.8 sackin_yule 0.050 -6.996394
38 38 0.8 sackin_yule 0.010 -10.536340
43 43 0.8 sackin_yule 0.005 -9.544065
48 48 0.8 sackin_yule 0.001 -7.196407
53 53 0.6 sackin_yule 0.100 -0.392256
58 58 0.6 sackin_yule 0.050 -6.621639 …Run Code Online (Sandbox Code Playgroud) 我正在努力swarmplot与之合作pandas.我有一个numpy array名为SIAggs 的3D ,我用pandas这样切片:
rand_center = {('Random_dist'):SIAggs[:,:,1], ('Center_distance'):SIAggs[:,:,0]}
for key, value in rand_center.items():
rand_center[key] = pd.DataFrame(value)
sizes = {}
for i in range(size_iterations):
sizes.update({ (str(i+1)) : SIAggs[i,:,:] })
for key, value in sizes.items():
sizes[key] = pd.DataFrame(value)
df = pd.concat(sizes, rand_center, names = ['sizes', 'distance_measure'])
df.stack()
Run Code Online (Sandbox Code Playgroud)
哪,当我打印DataFrame给我时:
sizes 1 2 3
distance_measure 0 1 0 1 0 1
0 -2.1881 1.262 -2.7001 1.493 -2.1381 1.626
1 -2.3671 1.699 -2.4431 1.208 -2.4571 …Run Code Online (Sandbox Code Playgroud) 我发现了一些关于这个问题的一般帖子(尤其是列表与数组),但我想知道是否有人知道使用 numpy.append 或重新分配条目是否更快?
具体来说,如果您知道您将拥有一个最大大小为 100 的数组,例如,但不确定最终大小,那么最好:
array_to_mod = np.zeros(100)
for something in loop:
array_to_mod[something] = new_value
final_array = array_to_mod[0:len(loop)]
Run Code Online (Sandbox Code Playgroud)
其中 loop 是一些你不知道的先验数字,除了它低于 100,或者是类似的东西:
final_array = np.array([])
for something in loop:
final_array = np.append(final_array, new_value)
Run Code Online (Sandbox Code Playgroud)
想法?