具有编码规范的fread(data.table in R)

Dmi*_*kin 5 csv r character-encoding data.table

在以前的问题和问题的答案中找不到合适的答案:1.我有一个2.3 GB的csv文件,其中包含240万行希伯来文本,目前以ASCII编码.既然我们在谈论大文件,那么fread会更好,但编码呢?任何想法如何读取ASCII编码的csv文件,以避免着名的"嵌入式字符串中的nul"错误?

谢谢

Ale*_* A. 5

从8月25日起,由David Arenburg链接的案例已关闭,该功能包含在data.table当前可用的版本中。现在可以在调用fread时使用encoding参数:

text <- fread(file, encoding = 'UTF-8')
Run Code Online (Sandbox Code Playgroud)

ASCII不是显式的编码选项,但是ASCII是有效的UTF-8,因此,当您要阅读希伯来语文本时,可以指定UTF-8。

  • 我正在使用 data.table 1.9.7(通过 `sessionInfo()` 确认),并且收到此错误: `fread("data.csv",encoding = "UTF-8") 中的错误:未使用的参数 (encoding = " UTF-8")` (3认同)