相关疑难解决方法(0)

比较熊猫数据框的行（行有一些重叠的值）

我有一个包含 21 列的 Pandas 数据框。我关注的是具有完全相同列数据值的行的子集，除了每行唯一的 6 个行。我不知道这 6 个值对应于哪个列标题。

我尝试将每一行转换为 Index 对象，并对两行执行设置操作。前任。

row1 = pd.Index(sample_data[0])
row2 = pd.Index(sample_data[1])
row1 - row2

Run Code Online (Sandbox Code Playgroud)

它返回一个 Index 对象，其中包含对 row1 唯一的值。然后我可以手动推断哪些列具有唯一值。

如何以编程方式获取这些值在初始数据框中对应的列标题？或者，有没有办法比较两个或多个数据框行并提取每行的 6 个不同列值以及相应的标题？理想情况下，生成具有唯一列的新数据框会很好。

特别是，有没有办法使用集合操作来做到这一点？

谢谢你。

python dataframe pandas

mli*_*imb

lucky-day

6
推荐指数

1
解决办法

4万
查看次数

在 groupby 数据帧（Python）中查找给定日期的最接近日期

我正在尝试Last_Payment_Date在我的 Pandas 数据框中生成字段，并且需要为每个客户（即 groupby）Payment_Date在给定之前找到最接近的字段Order_Date。

Payment_Date将始终发生在之后Order_Date，但可能需要不同的时间段，这很难使用排序和移位来找到最近的日期。

掩蔽似乎是一种可能的方式，但我一直无法想出如何使用它的方法。

感谢我能得到的所有帮助！

Cust_No  Order_Date  Payment_Date  Last_Payment_Date
      A    5/8/2014      6/8/2014                Nat
      B    6/8/2014      1/5/2015                Nat
      B    7/8/2014      7/8/2014                Nat
      A    8/8/2014      1/5/2015           6/8/2014
      A    9/8/2014     10/8/2014           6/8/2014
      A  10/11/2014    12/11/2014          10/8/2014
      B  11/12/2014      1/1/2015           7/8/2014
      B    1/2/2015      2/2/2015           1/1/2015
      A    2/5/2015      5/5/2015           1/5/2015
      B    3/5/2015      4/5/2015           2/2/2015

Run Code Online (Sandbox Code Playgroud)

python datetime group-by

tbk*_*tbk

2017 05-23

2
推荐指数

1
解决办法

1438
查看次数