我正在尝试找到一种方法,利用 pandasdrop_duplicates()来识别当值顺序相反时行是重复的。
drop_duplicates()
一个例子是,如果我试图查找客户同时购买苹果和香蕉的交易,但数据收集顺序可能会颠倒这些项目。换句话说,当合并为完整订单时,交易将被视为重复,因为它由相同的商品组成。
我希望以下内容被识别为重复项:
Item1 Item2 Apple Banana Banana Apple
duplicates python-2.7 pandas
duplicates ×1
pandas ×1
python-2.7 ×1