Dmi*_*kin 5 csv r character-encoding data.table
在以前的问题和问题的答案中找不到合适的答案:1.我有一个2.3 GB的csv文件,其中包含240万行希伯来文本,目前以ASCII编码.既然我们在谈论大文件,那么fread会更好,但编码呢?任何想法如何读取ASCII编码的csv文件,以避免着名的"嵌入式字符串中的nul"错误?
谢谢
从8月25日起,由David Arenburg链接的案例已关闭,该功能包含在data.table当前可用的版本中。现在可以在调用fread时使用encoding参数:
text <- fread(file, encoding = 'UTF-8')
Run Code Online (Sandbox Code Playgroud)
ASCII不是显式的编码选项,但是ASCII是有效的UTF-8,因此,当您要阅读希伯来语文本时,可以指定UTF-8。
| 归档时间: |
|
| 查看次数: |
7507 次 |
| 最近记录: |