具有编码规范的fread(data.table in R)

Question

在以前的问题和问题的答案中找不到合适的答案:1.我有一个2.3 GB的csv文件,其中包含240万行希伯来文本,目前以ASCII编码.既然我们在谈论大文件,那么fread会更好,但编码呢？任何想法如何读取ASCII编码的csv文件,以避免着名的"嵌入式字符串中的nul"错误？

谢谢

Answer 1

从8月25日起，由David Arenburg链接的案例已关闭，该功能包含在data.table当前可用的版本中。现在可以在调用fread时使用encoding参数：

text <- fread(file, encoding = 'UTF-8')

ASCII不是显式的编码选项，但是ASCII是有效的UTF-8，因此，当您要阅读希伯来语文本时，可以指定UTF-8。

我正在使用 data.table 1.9.7（通过 `sessionInfo()` 确认），并且收到此错误： `fread("data.csv",encoding = "UTF-8") 中的错误：未使用的参数 (encoding = " UTF-8")` (3认同)