Wes*_*eld 5 python tree hierarchical-clustering matplotlib pandas
所以我在pandas DataFrame中存储了分层信息,我想基于这些信息构建和可视化分层树.
例如,我的DataFrame中的一行有列标题 - ['Phylum','Class','Order','Family','Genus','Species','Subspecies']
我想用每一行创建一个树,其中所有'Subspecies'都是唯一的字符串,应该是树中的叶子.有人能指出我最好的方法/包装......这样做吗?理想情况下,输出将是matplotlib对象.先感谢您!
您可以使用 groupby 轻松地将它们放入分层索引中:
taxons = ['Phylum','Class','Order','Family','Genus','Species','Subspecies']
hierarchical_df = my_dataframe.groupby(taxons).sum() #sum or whatever is most appropiate for your data
Run Code Online (Sandbox Code Playgroud)
从那里开始,我还尝试绘制一个有意义的图来显示该层次结构(请参阅使用 bokeh 或 matplotlib 的 Pandas DataFrame 中的分层饼图/甜甜圈图?)
归档时间: |
|
查看次数: |
2966 次 |
最近记录: |