当我使用read.csv()函数R加载数据时,我经常发现X已添加到变量名中.我想我总是在第一个变量中看到它,但我可能是错的.
起初,我认为这R可能是因为我在变量名称的开头有一个空格 - 我没有.
其次,我曾经读过某个地方,如果你有一个以数字开头的变量,或者是一个非常短的变量名,R就会添加X.变量名是全文,这个变量名的长度是12个字符,所以它不短.
现在,这纯粹是一种烦恼.我可以重命名该列,但它确实添加了一个步骤,虽然是一个小步骤.
有没有办法阻止流氓X渗透我的数据框?
这是我的原始代码:
df <- read.csv("/file/location.filecsv", header=T, sep=",")
Run Code Online (Sandbox Code Playgroud)
这是有问题的变量:
str(orders)
'data.frame': 2620276 obs. of 26 variables:
$ X.OrderDetailID : Factor w/ 2620193 levels "(2620182 row(s) affected)",..: 105845
Run Code Online (Sandbox Code Playgroud) 我正在尝试对每个数据进行分组year和求和,但是当创建新数据框时,列名称以恼人的“X”开头,例如“ ”而不是。当然,我可以在创建后将其删除或替换为“”,但我希望不要从一开始就创建它,因为此方法将应用于具有更多列的数据帧。 weightyearX20002000
library(tidyverse)
year<-c("2000","2000","2001","2002","2000","2002")
weight<-c(0.5,0.7,0.8,0.7,0.6,0.9)
YG<-data.frame(year,weight)
w<-data.frame(YG %>%
group_by(year) %>%
summarise(n = round(sum(weight)),
g = n()) %>%
select(-g) %>%
spread(year, n, fill = 0))
Run Code Online (Sandbox Code Playgroud) 当我通过 R 读取 csv 文件时,所有特定符号(>,<)都被点(。)替换。
例如:
csv 文件:用户>75
R 显示用户 75
我怎样才能避免这种情况?