小编Joh*_*ohn的帖子

在数据框的选定列中包含NA(缺失)值的行的子集

我们有一个CSV文件的数据框.数据框DF包含包含观察值的列和VaR2包含测量日期的列().如果未记录日期,则CSV文件包含NA缺失数据的值.

Var1  Var2 
10   2010/01/01
20   NA
30   2010/03/01
Run Code Online (Sandbox Code Playgroud)

我们希望使用subset命令来定义一个新的数据框new_DF,使其只包含具有NA'column(VaR2)值的行.在给出的示例中,只有第2行将包含在新的中DF.

命令

new_DF<-subset(DF,DF$Var2=="NA") 
Run Code Online (Sandbox Code Playgroud)

不起作用,结果数据框没有行条目.

如果在原始CSV文件NA中交换 了值NULL,则相同的命令会产生所需的结果:new_DF<-subset(DF,DF$Var2=="NULL").

如果字符串NA在原始CSV文件中提供了值,那么如何使此方法有效?

csv r subset dataframe na

87
推荐指数
6
解决办法
24万
查看次数

动物园对象聚合

亲爱的社区,

我收到的数据将在数据框中:

Var_1      Var_2         Date        VaR_3  VaR_4   VaR_5   Var_6
1           4       2010-01-18         7    apple    10    sweet
2           5       2010-07-19         8    orange   11    sour
3           6       2010-01-18         9    kiwi     12    juicy
...        ...      ...               ...   ...     ...    ... 
Run Code Online (Sandbox Code Playgroud)

我想使用zoo,因为它似乎是一个灵活的对象类.我只是从R开始,我试图阅读包的描述(小插曲).

问题:

  1. 鉴于以上数据为数据框,建议将完整的df转换为动物园对象,告诉动物园它应该使用第三列作为日期列(日期可以在数据中多次出现)?
  2. 如何使用动物园内置函数每月汇总所有其他列,第4列和第6列除外?动物园是否能够自动丢弃分类变量并只使用那些适合聚合的列?
  3. 对于第4列中的每个类别,如何按月汇总所有数字列(第6列不应包括在内,因为它不是数字的).

感谢您的支持.

r dataframe zoo

6
推荐指数
1
解决办法
1896
查看次数

Boxplot - 使用变量访问列名

如何使用包含列名称的变量来访问列?

假设我们有一个包含3列的数据帧DF: Var1 Var2 Var3,其中Var3包含数值数据,Var1和Var2包含几个因子.

我们想使用包含列名称的临时变量生成2个箱图:

temp<-"Var3"
boxplot(DF[temp]) #(<--that works).
Run Code Online (Sandbox Code Playgroud)

如果我使用相同的方法来获取Var2中每个因子的箱图,它不会:

boxplot(DF[temp]~DF$Var2) #(<-- does not work).
Run Code Online (Sandbox Code Playgroud)

我怎样才能使这个工作?

注释:如果我直接使用名称"Var3",它确实有效并显示几个箱图:

boxplot(DF$Var3~DF$Var2).

r boxplot

2
推荐指数
1
解决办法
7273
查看次数

标签 统计

r ×3

dataframe ×2

boxplot ×1

csv ×1

na ×1

subset ×1

zoo ×1