小编Ben*_*Ben的帖子

pandas group by year,按销售列排名,在具有重复数据的数据框中

我想创建一年的排名(因此在2012年,经理B为1. 2011年,经理B再次为1).我和pandas rank函数挣扎了一段时间,并且不想求助于for循环.

s = pd.DataFrame([['2012','A',3],['2012','B',8],['2011','A',20],['2011','B',30]], columns=['Year','Manager','Return'])

Out[1]:     
   Year Manager  Return    
0  2012       A       3    
1  2012       B       8    
2  2011       A      20    
3  2011       B      30
Run Code Online (Sandbox Code Playgroud)

我遇到的问题是附加代码(之前认为这不相关):

s = pd.DataFrame([['2012', 'A', 3], ['2012', 'B', 8], ['2011', 'A', 20], ['2011', 'B', 30]], columns=['Year', 'Manager', 'Return'])
b = pd.DataFrame([['2012', 'A', 3], ['2012', 'B', 8], ['2011', 'A', 20], ['2011', 'B', 30]], columns=['Year', 'Manager', 'Return'])

s = s.append(b)
s['Rank'] = s.groupby(['Year'])['Return'].rank(ascending=False)

raise Exception('Reindexing only valid with uniquely valued Index '
Exception: Reindexing only …
Run Code Online (Sandbox Code Playgroud)

python duplicates rank pandas pandas-groupby

16
推荐指数
1
解决办法
2万
查看次数

拓扑数据分析 - 从哪里开始

我最近遇到了"拓扑数据分析"(TDA),它是一种可视化大型数据集的独特方式.这是一份斯坦福大学的论文,其结果示例为https://research.math.osu.edu/tgda/mapperPBG.pdf.

我想产生类似的结果,但我很难在网上找到可运行的代码,你可以在网上安装软件包,加载样本数据,然后执行几行(比如http://scikit-learn.org/ examples).我的语言偏好是Python,但也可以使用R.

有没有人能够吸引TDA,如果有的话,有关如何获取代码并运行的任何建议吗?

python visualization r topology

11
推荐指数
2
解决办法
7796
查看次数

标签 统计

python ×2

duplicates ×1

pandas ×1

pandas-groupby ×1

r ×1

rank ×1

topology ×1

visualization ×1