相关疑难解决方法(0)

使用BOM读取UTF-8文本文件

我有一个文本文件,开头有字节顺序标记(U + FEFF).我试图在R中读取文件.是否可以避免字节顺序标记?

函数fread(来自data.table包)读取文件,但?»æ在第一个变量名的开头添加:

> names(frame_pers)[1]
[1] "?Ⱦreg_date"
Run Code Online (Sandbox Code Playgroud)

同样是与read.csv功能.

目前我已经创建了一个从第一列名称中删除BOM的功能,但我相信应该有一种方法来自动剥离BOM.

remove.BOM <- function(x) setnames(x, 1, substring(names(x)[1], 4))

> names(frame_pers)[1]
[1] "?Ⱦreg_date"
> remove.BOM(frame_pers)
> names(frame_pers)[1]
[1] "reg_date"
Run Code Online (Sandbox Code Playgroud)

我正在使用R会话的本机编码:

> options("encoding" = "")
> options("encoding")
$encoding
[1] ""
Run Code Online (Sandbox Code Playgroud)

unicode byte-order-mark r utf-8 character-encoding

15
推荐指数
2
解决办法
1万
查看次数

标签 统计

byte-order-mark ×1

character-encoding ×1

r ×1

unicode ×1

utf-8 ×1