我有两个具有相同列名和dtypes的数据框,类似于以下内容:
A object
B category
C category
Run Code Online (Sandbox Code Playgroud)
每个数据帧中的类别都不相同。
通常情况下,熊猫输出:
A object
B object
C object
Run Code Online (Sandbox Code Playgroud)
根据文档,这是预期的行为。
但是,我希望保持分类并希望合并类别,因此我在数据框中的所有类别的列中尝试了union_categoricals。cdf这df是我的两个数据框。
for column in df:
if df[column].dtype.name == "category" and cdf[column].dtype.name == "category":
print (column)
union_categoricals([cdf[column], df[column]], ignore_order=True)
cdf = pd.concat([cdf,df])
Run Code Online (Sandbox Code Playgroud)
这仍然不能为我提供绝对的输出。