相关疑难解决方法(0)

比较熊猫数据框的行(行有一些重叠的值)

我有一个包含 21 列的 Pandas 数据框。我关注的是具有完全相同列数据值的行的子集,除了每行唯一的 6 个行。我不知道这 6 个值对应于哪个列标题。

我尝试将每一行转换为 Index 对象,并对两行执行设置操作。前任。

row1 = pd.Index(sample_data[0])
row2 = pd.Index(sample_data[1])
row1 - row2 
Run Code Online (Sandbox Code Playgroud)

它返回一个 Index 对象,其中包含对 row1 唯一的值。然后我可以手动推断哪些列具有唯一值。

如何以编程方式获取这些值在初始数据框中对应的列标题?或者,有没有办法比较两个或多个数据框行并提取每行的 6 个不同列值以及相应的标题?理想情况下,生成具有唯一列的新数据框会很好。

特别是,有没有办法使用集合操作来做到这一点?

谢谢你。

python dataframe pandas

6
推荐指数
1
解决办法
4万
查看次数

在 groupby 数据帧(Python)中查找给定日期的最接近日期

我正在尝试Last_Payment_Date在我的 Pandas 数据框中生成字段,并且需要为每个客户(即 groupby)Payment_Date在给定之前找到最接近的字段Order_Date

Payment_Date将始终发生在 之后Order_Date,但可能需要不同的时间段,这很难使用排序和移位来找到最近的日期。

掩蔽似乎是一种可能的方式,但我一直无法想出如何使用它的方法。

感谢我能得到的所有帮助!

Cust_No  Order_Date  Payment_Date  Last_Payment_Date
      A    5/8/2014      6/8/2014                Nat
      B    6/8/2014      1/5/2015                Nat
      B    7/8/2014      7/8/2014                Nat
      A    8/8/2014      1/5/2015           6/8/2014
      A    9/8/2014     10/8/2014           6/8/2014
      A  10/11/2014    12/11/2014          10/8/2014
      B  11/12/2014      1/1/2015           7/8/2014
      B    1/2/2015      2/2/2015           1/1/2015
      A    2/5/2015      5/5/2015           1/5/2015
      B    3/5/2015      4/5/2015           2/2/2015
Run Code Online (Sandbox Code Playgroud)

python datetime group-by

2
推荐指数
1
解决办法
1438
查看次数

标签 统计

python ×2

dataframe ×1

datetime ×1

group-by ×1

pandas ×1