Jaq*_*har 5 python numpy machine-learning pandas data-science
如何比较2个不同的Pandas数据框的列名。我想比较训练数据帧和测试数据帧,其中测试数据帧中缺少某些列?
pandas.Index
对象(包括数据框列)具有set
类似类的有用方法,例如intersection
和difference
。
例如,给定的数据帧train
和test
:
train_cols = train.columns
test_cols = test.columns
common_cols = train_cols.intersection(test_cols)
train_not_test = train_cols.difference(test_cols)
Run Code Online (Sandbox Code Playgroud)