打开巨大的文本文件,unicode 问题

Pre*_*sen 1 python unicode text python-3.x

我正在尝试打开一个文本文件并打印它的第一行。

\n\n

我的代码是:

\n\n
dataFile = open(\'data/AllData_2000001_3000000.txt\', \'r\', encoding="latin-1")\nprint(dataFile.read(1000))\n
Run Code Online (Sandbox Code Playgroud)\n\n

输入是

\n\n
The bug is hitting\n
Run Code Online (Sandbox Code Playgroud)\n\n

我的输出是

\n\n
\xc3\xbf\xc3\xbeT h e  b u g  i s  h i t t i n g\n
Run Code Online (Sandbox Code Playgroud)\n\n

iso-8859-1也给出相同的结果。
\n当我尝试utf-8时时,出现以下错误:

\n\n
UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xff in position 0: invalid start byte\n
Run Code Online (Sandbox Code Playgroud)\n\n

我的错误是什么?
\n谢谢!

\n

roi*_*ppi 6

\xc3\xbf\xc3\xbe可能是文件中的BOMUTF-16。尝试在打开它时将其指定为编码。

\n