R中的fread data.table不读取列名

Question

R中的fread data.table不读取列名

将数据文件读入R时,我可以将其作为a data.frame或data.table使用data.table包读取.我希望data.table将来使用,因为它更好地处理大数据.但是,这两种方法都有问题(read.table对于data.frames,fread对于data.tables),我想知道是否有一个简单的修复方法.

当我read.table用来制作a时data.frame,如果我的列名包括冒号或空格,它们会被句号所取代,这是我不想要的.我希望"按原样"读取列名称.

或者,当我fread用来制作a时data.table,我的列名完全没有被读入,这显然是不可取的.

请查看下面的这个要点,以获得可重现的示例:

https://gist.github.com/jeffbruce/b966d41eedc2662bbd4a

干杯

Answer 1

eks*_*oem 9

这是一个可行的解决方案.我不确定它是否是最短的解决方案,或者您可以通过巧妙地使用drop数据表来实现,但下面的黑客确实有效."问题"是文件中的行号.

首先读入头文件,然后将其添加到数据表中

header <- read.table("yourfile.csv", header = TRUE, nrow = 1)
indata <- fread("yourfile.csv", skip=1, header=FALSE)
setnames(indata, colnames(header))

Run Code Online (Sandbox Code Playgroud)

Answer 2

Dha*_*pil 6

R总是尝试转换列名以确保它们是有效的变量名,因此它会添加句点代替空格和冒号.如果你不想要,你可以在使用check.names=FALSE时使用read.table

df1<-read.table("data.txt",check.names = FALSE)

sample(colnames(df1),10)
 [1] "simple lobule white matter"                       
 [2] "anterior lobule white matter"                     
 [3] "hippocampus"                                      
 [4] "lateral olfactory tract"                          
 [5] "lobules 1-2: lingula and central lobule (ventral)"
 [6] "Medial parietal association cortex"               
 [7] "Primary somatosensory cortex: trunk region"       
 [8] "midbrain"                                         
 [9] "Secondary auditory cortex: ventral area"          
[10] "Primary somatosensory cortex: forelimb region"

Run Code Online (Sandbox Code Playgroud)

你可以看到它colnames保持不变.

归档时间：	10 年，2 月前
查看次数：	3568 次
最近记录：	10 年，2 月前