小编Ric*_*cky的帖子

绘图时如何从 jupyter notebook 中删除 matplotlib 输出行

例如,当我绘制一些东西并添加标题等时,我会在实际绘图显示之前得到一个显示输出的行列表,如下所示,有时是很长的列表。

<matplotlib.figure.Figure at 0x244deb8dd68>

<matplotlib.axes._subplots.AxesSubplot at 0x244deb99358>

<matplotlib.text.Text at 0x244defc9240>
Run Code Online (Sandbox Code Playgroud)

绘图时有没有办法隐藏这些?

python matplotlib jupyter-notebook

9
推荐指数
1
解决办法
5290
查看次数

R dplyr方法用NA替换所有空因子

而不是编写和读取数据框来填充此方法中的所有空因子,

na.strings=c("","NA")
Run Code Online (Sandbox Code Playgroud)

我想将一个函数应用于所有列,并用NA替换空.到目前为止,我已经选择了因子列,但不知道下一步该做什么.

df %>% select_if(is.factor) %>% ....
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点,最好使用dplyr和/或apply方法

r dplyr

5
推荐指数
1
解决办法
1254
查看次数

按变量分组,然后查找 R 中每列缺失值的比例

我有一个带有因子变量的数据框和带有几个 NA 的列,如图所示。

var col1 col2 col3
C    1    NA   1
A    NA   1    1 
C    NA   NA   NA
A    1    NA   1
B    NA   1    1
A    1    1    1
B    1    NA   1
B    1    1    1
C    NA   NA   1
B    NA   1   1
Run Code Online (Sandbox Code Playgroud)

我正在寻找一种对变量进行分组并获取每列缺失值的比例的方法,并按“var”中的级别进行分组。输出应如下所示:

var col1 col2 col3
A    0.33 0.33  0
B    0.5  0.25  0 
C    0.66 1.00  0.33
Run Code Online (Sandbox Code Playgroud)

任何方法都可以,并且会赞赏不同的方法,但首选简单的 dplyr 方法。谢谢!

编辑:我正在寻找一种方法,该方法允许我一次对多个列执行此操作,并返回与我上面显示的数据框类似的数据框。

假设我的数据名为“df”,那么我想立即获取所有列的缺失比例,而不必再次手动输入名称。

以下代码不起作用,但它是我想要实现的目标的总体思路。也许一个函数可以提供帮助,但我不确定如何处理它。

df %>% group_by(var) %>% summarise(names(df[,-1]) = sum(is.na(names(df[,-1])))/n())

r dplyr tidyverse

1
推荐指数
1
解决办法
2443
查看次数

标签 统计

dplyr ×2

r ×2

jupyter-notebook ×1

matplotlib ×1

python ×1

tidyverse ×1