我有一个包含 21 列的 Pandas 数据框。我关注的是具有完全相同列数据值的行的子集,除了每行唯一的 6 个行。我不知道这 6 个值对应于哪个列标题。
我尝试将每一行转换为 Index 对象,并对两行执行设置操作。前任。
row1 = pd.Index(sample_data[0])
row2 = pd.Index(sample_data[1])
row1 - row2
Run Code Online (Sandbox Code Playgroud)
它返回一个 Index 对象,其中包含对 row1 唯一的值。然后我可以手动推断哪些列具有唯一值。
如何以编程方式获取这些值在初始数据框中对应的列标题?或者,有没有办法比较两个或多个数据框行并提取每行的 6 个不同列值以及相应的标题?理想情况下,生成具有唯一列的新数据框会很好。
特别是,有没有办法使用集合操作来做到这一点?
谢谢你。
我正在尝试Last_Payment_Date在我的 Pandas 数据框中生成字段,并且需要为每个客户(即 groupby)Payment_Date在给定之前找到最接近的字段Order_Date。
Payment_Date将始终发生在 之后Order_Date,但可能需要不同的时间段,这很难使用排序和移位来找到最近的日期。
掩蔽似乎是一种可能的方式,但我一直无法想出如何使用它的方法。
感谢我能得到的所有帮助!
Cust_No Order_Date Payment_Date Last_Payment_Date
A 5/8/2014 6/8/2014 Nat
B 6/8/2014 1/5/2015 Nat
B 7/8/2014 7/8/2014 Nat
A 8/8/2014 1/5/2015 6/8/2014
A 9/8/2014 10/8/2014 6/8/2014
A 10/11/2014 12/11/2014 10/8/2014
B 11/12/2014 1/1/2015 7/8/2014
B 1/2/2015 2/2/2015 1/1/2015
A 2/5/2015 5/5/2015 1/5/2015
B 3/5/2015 4/5/2015 2/2/2015
Run Code Online (Sandbox Code Playgroud)