R使用特定编码读取tsv文件

scr*_*Owl 8 r tsv

我试图使用特定的编码将.tsv(制表符分隔值)文件读入R.据说这是windows-1252.它有一个标题.

有关代码将其放入数据框的任何建议吗?

Tom*_*mmy 19

也许这样的事情?

mydf <- read.table('thefile.txt', header=TRUE, sep="\t", fileEncoding="windows-1252")
str(mydf)
Run Code Online (Sandbox Code Playgroud)


小智 6

您还可以使用:

read.delim('thefile.txt', header= T, fileEncoding= "windows-1252")

只需将命令输入您的R consol:

 > read.delim
function (file, header = TRUE, sep = "\t", quote = "\"", dec = ".", 
    fill = TRUE, comment.char = "", ...) 
read.table(file = file, header = header, sep = sep, quote = quote, 
    dec = dec, fill = fill, comment.char = comment.char, ...)
Run Code Online (Sandbox Code Playgroud)

揭示了这read.delim是一个打包的read.table命令,它已经指定了制表符作为数据的分隔符.read.delim如果你正在使用大量的tsv文件可能会更方便.

在这个Stack问题中更详细地讨论了这两个命令之间的区别.