我们有一个CSV文件的数据框.数据框DF包含包含观察值的列和VaR2包含测量日期的列().如果未记录日期,则CSV文件包含NA缺失数据的值.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Run Code Online (Sandbox Code Playgroud)
我们希望使用subset命令来定义一个新的数据框new_DF,使其只包含具有NA'column(VaR2)值的行.在给出的示例中,只有第2行将包含在新的中DF.
命令
new_DF<-subset(DF,DF$Var2=="NA")
Run Code Online (Sandbox Code Playgroud)
不起作用,结果数据框没有行条目.
如果在原始CSV文件NA中交换 了值NULL,则相同的命令会产生所需的结果:new_DF<-subset(DF,DF$Var2=="NULL").
如果字符串NA在原始CSV文件中提供了值,那么如何使此方法有效?
亲爱的社区,
我收到的数据将在数据框中:
Var_1 Var_2 Date VaR_3 VaR_4 VaR_5 Var_6
1 4 2010-01-18 7 apple 10 sweet
2 5 2010-07-19 8 orange 11 sour
3 6 2010-01-18 9 kiwi 12 juicy
... ... ... ... ... ... ...
Run Code Online (Sandbox Code Playgroud)
我想使用zoo,因为它似乎是一个灵活的对象类.我只是从R开始,我试图阅读包的描述(小插曲).
问题:
感谢您的支持.
如何使用包含列名称的变量来访问列?
假设我们有一个包含3列的数据帧DF: Var1 Var2 Var3,其中Var3包含数值数据,Var1和Var2包含几个因子.
我们想使用包含列名称的临时变量生成2个箱图:
temp<-"Var3"
boxplot(DF[temp]) #(<--that works).
Run Code Online (Sandbox Code Playgroud)
如果我使用相同的方法来获取Var2中每个因子的箱图,它不会:
boxplot(DF[temp]~DF$Var2) #(<-- does not work).
Run Code Online (Sandbox Code Playgroud)
我怎样才能使这个工作?
注释:如果我直接使用名称"Var3",它确实有效并显示几个箱图:
boxplot(DF$Var3~DF$Var2).