拓扑数据分析 - 从哪里开始

Ben*_*Ben 11 python visualization r topology

我最近遇到了"拓扑数据分析"(TDA),它是一种可视化大型数据集的独特方式.这是一份斯坦福大学的论文,其结果示例为https://research.math.osu.edu/tgda/mapperPBG.pdf.

我想产生类似的结果,但我很难在网上找到可运行的代码,你可以在网上安装软件包,加载样本数据,然后执行几行(比如http://scikit-learn.org/ examples).我的语言偏好是Python,但也可以使用R.

有没有人能够吸引TDA,如果有的话,有关如何获取代码并运行的任何建议吗?

von*_*njd 7

有一个新的r包:

TDA:拓扑数据分析的统计工具
该软件包提供了持久同源性和密度聚类统计分析的工具.

可以在这里找到写得很好的插图:R包TDA简介

抽象

我们提供了一个简短的教程和使用R包TDA的介绍,它提供了拓扑数据分析的一些工具.特别地,它包括函数的实现,给定一些数据,提供关于底层空间的拓扑信息,例如距离函数,到度量的距离,kNN密度估计器,核密度估计器和内核距离.这些函数的次级集(或超级集)的显着拓扑特征可以用持久的同源性来量化.我们为C++库GUDHI,Dionysus和PHAT的高效算法提供了一个R接口,包括一个用于Rips过滤的持久同源性的函数,以及一个用于评估任意函数的次级集(或超级集)的持久同源性的R接口.一个点网格.可以使用实现Fasy,Lecci,Rinaldo,Wasserman,Balakrishnan和Singh(2014),Chazal,Fasy,Lecci,Rinaldo和Wasserman(2014c)中讨论的方法的函数来分析所得到的持久性图中的特征的重要性.和Chazal,Fasy,Lecci,Michel,Rinaldo和Wasserman(2014a).R包TDA还包括用于密度聚类的算法的实现,其允许我们识别与密度函数相关联的概率质量的空间组织,并通过树状图(群树)将其可视化.


Ser*_*top 2

对于可视化,Cytoscape有桌面版和浏览器版。

它建议在这里生成两个 python 库(Bioconductor 和 igraph) 。