小编Meh*_*han的帖子

高效的pandas grouby + nunique滚动计算

我正在尝试构建一种可扩展的方法来计算修改了某个文件(截至并包括最新的modified_date)的唯一成员的数量。该unique_member_until_now列包含每个文件的预期结果。

import pandas as pd
from pandas import Timestamp

# Example Dataset

df = pd.DataFrame({'File': ['A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'C', 'C', 'C'],
 'Member': ['X', 'X', 'Y', 'X', 'Y', 'Y', 'X', 'Z', 'Y', 'X', 'Y', 'X'],
 'modified_date': [Timestamp('2021-11-25 00:00:00'),
  Timestamp('2021-11-28 00:00:00'),
  Timestamp('2021-12-14 00:00:00'),
  Timestamp('2021-10-17 00:00:00'),
  Timestamp('2021-11-01 00:00:00'),
  Timestamp('2021-11-04 00:00:00'),
  Timestamp('2021-11-16 00:00:00'),
  Timestamp('2021-12-16 00:00:00'),
  Timestamp('2021-12-29 00:00:00'),
  Timestamp('2021-10-30 00:00:00'),
  Timestamp('2021-11-23 00:00:00'),
  Timestamp('2021-12-17 00:00:00')],
 'unique_member_until_now': [1, 1, 2, 1, 2, 2, 2, 3, 3, 1, 2, 2]}) …
Run Code Online (Sandbox Code Playgroud)

python pandas rolling-computation pandas-groupby

6
推荐指数
1
解决办法
276
查看次数

Ripley的K函数(二阶强度函数)Python

我在Python中寻找Ripley的k函数实现.但到目前为止还没有找到任何在scipy或其他地方实现这一点的空间模块.

我已经创建了纤维复合材料的Voronoi镶嵌,并且需要使用Ripley的K和配对分布函数与泊松分布进行分析.

无法上传图片 - 没有足够的代表.

python spatial

5
推荐指数
1
解决办法
1248
查看次数

熊猫每N行将数据框重塑为列

我有一个数据框如下:

df1=pd.DataFrame(np.arange(24).reshape(6,-1),columns=['a','b','c','d'])
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

我想采用3组行并将它们按以下顺序转换为列

在此处输入图片说明

整形重塑没有给出预期的答案

pd.DataFrame(np.reshape(df1.values,(3,-1)),columns=['a','b','c','d','e','f','g','h'])
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

python numpy reshape pandas

4
推荐指数
1
解决办法
2165
查看次数