例如,当我绘制一些东西并添加标题等时,我会在实际绘图显示之前得到一个显示输出的行列表,如下所示,有时是很长的列表。
<matplotlib.figure.Figure at 0x244deb8dd68>
<matplotlib.axes._subplots.AxesSubplot at 0x244deb99358>
<matplotlib.text.Text at 0x244defc9240>
Run Code Online (Sandbox Code Playgroud)
绘图时有没有办法隐藏这些?
而不是编写和读取数据框来填充此方法中的所有空因子,
na.strings=c("","NA")
Run Code Online (Sandbox Code Playgroud)
我想将一个函数应用于所有列,并用NA替换空.到目前为止,我已经选择了因子列,但不知道下一步该做什么.
df %>% select_if(is.factor) %>% ....
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点,最好使用dplyr和/或apply方法
我有一个带有因子变量的数据框和带有几个 NA 的列,如图所示。
var col1 col2 col3
C 1 NA 1
A NA 1 1
C NA NA NA
A 1 NA 1
B NA 1 1
A 1 1 1
B 1 NA 1
B 1 1 1
C NA NA 1
B NA 1 1
Run Code Online (Sandbox Code Playgroud)
我正在寻找一种对变量进行分组并获取每列缺失值的比例的方法,并按“var”中的级别进行分组。输出应如下所示:
var col1 col2 col3
A 0.33 0.33 0
B 0.5 0.25 0
C 0.66 1.00 0.33
Run Code Online (Sandbox Code Playgroud)
任何方法都可以,并且会赞赏不同的方法,但首选简单的 dplyr 方法。谢谢!
编辑:我正在寻找一种方法,该方法允许我一次对多个列执行此操作,并返回与我上面显示的数据框类似的数据框。
假设我的数据名为“df”,那么我想立即获取所有列的缺失比例,而不必再次手动输入名称。
以下代码不起作用,但它是我想要实现的目标的总体思路。也许一个函数可以提供帮助,但我不确定如何处理它。
df %>% group_by(var) %>% summarise(names(df[,-1]) = sum(is.na(names(df[,-1])))/n())