假设有一个包含两列的数据框,其中col1表示组。
d = pd.DataFrame({'col1': ['a','a','a','a', 'a', 'b','b'], 'col2': ['nmh','ghb','dfe', 'dfe', 'kil', 'gtr','klm']})
Run Code Online (Sandbox Code Playgroud)
我想添加第三列,它使用 中的组col1和 中的条目col2,并添加一个线性顺序,如下所示:
order = [1,2,3,3,4, 1,2]
d['order'] = order
d
Run Code Online (Sandbox Code Playgroud)
col2将主要是唯一的,如果有任何重复order列应该重复订单号。
我用过groupby,rank没有用。通常提供method='first'给rank方法应该可以解决问题,但会出现错误。
注意: df 会大得多,对应于col1. 所以请提供一个可概括的答案。
是否可以mark_rect()在Altair python图中使用创建的热图中添加一些间距?图1中的热图将转换为图2中的热图。您可以假定这是来自a,dataframe并且每一列都对应一个变量。我故意这样画白条,以避免任何硬编码的索引解决方案。基本上,我正在寻找一种解决方案,可以提供列名和/或索引名以获取垂直和/或水平绘制的白色间距。