打开巨大的文本文件，unicode 问题

Question

我正在尝试打开一个文本文件并打印它的第一行。

\n\n

我的代码是：

\n\n

dataFile = open(\'data/AllData_2000001_3000000.txt\', \'r\', encoding="latin-1")\nprint(dataFile.read(1000))\n

输入是

\n\n

The bug is hitting\n

我的输出是

\n\n

\xc3\xbf\xc3\xbeT h e  b u g  i s  h i t t i n g\n

iso-8859-1也给出相同的结果。
\n当我尝试utf-8时时，出现以下错误：

\n\n

UnicodeDecodeError: \'utf-8\' codec can\'t decode byte 0xff in position 0: invalid start byte\n

我的错误是什么？
\n谢谢！

\n

Answer 1

这\xc3\xbf\xc3\xbe可能是文件中的BOMUTF-16。尝试在打开它时将其指定为编码。

\n