小编dod*_*545的帖子

散点图上的大量数据

假设我有一个大型数据集(8500000X50)。我想散布图X(日期)和Y(在某天进行的测量)。

我只能得到这个: 在此处输入图片说明

data_X = data['date_local']
data_Y = data['arithmetic_mean']
data_Y = data_Y.round(1)
data_Y = data_Y.astype(int)
data_X = data_X.astype(int)
sns.regplot(data_X, data_Y, data=data)
plt.show()
Run Code Online (Sandbox Code Playgroud)

根据我在Stackoverflow上发现的“相同”问题,我可以重新整理数据或采用1000个随机值进行绘制。但是如何以每个X(进行特定测量的日期)对应于实际(Y测量)的方式来实现它。

python matplotlib pandas seaborn

5
推荐指数
1
解决办法
5018
查看次数

更改多个列名称

假设我有一个具有此类列名称的数据框:

['a','b','c','d','e','f','g'] 
Run Code Online (Sandbox Code Playgroud)

我想将名称从“c”更改为“f”(实际上将字符串添加到列的名称中),因此整个数据框列名称将如下所示:

['a','b','var_c_equal','var_d_equal','var_e_equal','var_f_equal','g']
Run Code Online (Sandbox Code Playgroud)

好吧,首先我创建了一个函数,用我想要的字符串更改列名称:

df.rename(columns=lambda x: 'or_'+x+'_no', inplace=True)
Run Code Online (Sandbox Code Playgroud)

但现在我真的想了解如何实现这样的事情:

df.loc[:,'c':'f'].rename(columns=lambda x: 'var_'+x+'_equal', inplace=True)
Run Code Online (Sandbox Code Playgroud)

python pandas

5
推荐指数
1
解决办法
424
查看次数

标签 统计

pandas ×2

python ×2

matplotlib ×1

seaborn ×1