小编sau*_*har的帖子

如何在R中创建"堆叠瀑布"图表?

我能够在R中找到几个用于创建瀑布图的包,如下所示: R中的大多数包可以创建的瀑布图 但我找不到一种方法来创建如下所示的堆叠瀑布图: 堆积瀑布图的示例

解决方法是使用堆积条形图.但这不是一种优雅的方式.所以,我想知道是否有更好的方法在R中创建堆叠瀑布图.

r data-visualization

8
推荐指数
1
解决办法
1913
查看次数

替代python pandas中的mutate(dplyr包)

是否存在类似于R的Python pandas函数dplyr::mutate(),该函数可以通过在分组数据的列之一上应用函数来向分组数据添加新列?下面是对该问题的详细说明:

我使用以下代码生成了示例数据:

x <- data.frame(country = rep(c("US", "UK"), 5), state = c(letters[1:10]), pop=sample(10000:50000,10))
Run Code Online (Sandbox Code Playgroud)

现在,我想添加一个新列,该列具有美国和英国的最大人口。我可以使用以下R代码来做到这一点...

x <- group_by(x, country)
x <- mutate(x,max_pop = max(pop))
x <- arrange(x, country)
Run Code Online (Sandbox Code Playgroud)

...或等效地,使用R dplyr管道运算符:

x %>% group_by(country) %>% mutate(max_pop = max(pop)) %>% arrange(country)
Run Code Online (Sandbox Code Playgroud)

所以我的问题是我如何在Python中使用熊猫做到这一点?我尝试了以下操作,但没有成功

x['max_pop'] = x.groupby('country').pop.apply(max)
Run Code Online (Sandbox Code Playgroud)

python r pandas dplyr mutate

4
推荐指数
1
解决办法
1877
查看次数

标签 统计

r ×2

data-visualization ×1

dplyr ×1

mutate ×1

pandas ×1

python ×1