使用pandas在Python中创建和绘制分层树

Wes*_*eld 5 python tree hierarchical-clustering matplotlib pandas

所以我在pandas DataFrame中存储了分层信息,我想基于这些信息构建和可视化分层树.

例如,我的DataFrame中的一行有列标题 - ['Phylum','Class','Order','Family','Genus','Species','Subspecies']

我想用每一行创建一个树,其中所有'Subspecies'都是唯一的字符串,应该是树中的叶子.有人能指出我最好的方法/包装......这样做吗?理想情况下,输出将是matplotlib对象.先感谢您!

Adr*_*gué 3

您可以使用 groupby 轻松地将它们放入分层索引中:

taxons = ['Phylum','Class','Order','Family','Genus','Species','Subspecies']
hierarchical_df = my_dataframe.groupby(taxons).sum() #sum or whatever is most appropiate for your data
Run Code Online (Sandbox Code Playgroud)

从那里开始,我还尝试绘制一个有意义的图来显示该层次结构(请参阅使用 bokeh 或 matplotlib 的 Pandas DataFrame 中的分层饼图/甜甜圈图?