小编Oli*_*ace的帖子

生成具有精确均值和标准差的样本数据

我想创建一个具有特定平均值和标准偏差的数据集。

使用 np.random.normal() 给我一个近似值。但是,对于我想要测试的内容,我需要一个精确的均值和标准差。

我曾尝试使用 norm.pdf 和 np.linspace 的组合,但是生成的数据集也不匹配(不过可能只是我误用了它)。

只要我可以设置特定的样本大小、均值和标准偏差,数据集是否随机并不重要。

帮助将不胜感激

python statistics dataset

6
推荐指数
2
解决办法
5605
查看次数

按小时分组,同时考虑夏令时

我正在查看每天24小时工作的工厂的班次数据.我想在每次班次变更时对数据进行分组,即6:00和18:00.到目前为止,我一直在尝试:

Data_Frame.groupby([pd.Grouper(freq='12H')]).count() 
Run Code Online (Sandbox Code Playgroud)

但是我已经意识到,由于频率设置为12H,它总是需要12个小时,包括夏令时.

不幸的是,即使时钟发生变化,它总是在6:00和18:00.这意味着实际上一年中有一个时间长度为11个小时,另一个时间长度为13个小时,因此在年中组中有1个小时.

我觉得这是一个基本的东西(夏令时),应该有一些方法告诉大熊猫它需要考虑夏令时.

我已经尝试将它从UTC改为欧洲/伦敦,但它仍需要12个小时的时间.

非常感谢

编辑:

我发现这样做的唯一方法就是,在使用groupby之前将数据拆分为3(在第一个小时更改之前,在小时更改之前,第二个小时更改之前),逐个使用groupby然后将它们重新组合在一起,但这很烦人且乏味所以比这更好的东西是非常感激的.

python datetime dst pandas-groupby

5
推荐指数
1
解决办法
115
查看次数

标签 统计

python ×2

dataset ×1

datetime ×1

dst ×1

pandas-groupby ×1

statistics ×1