'utf-8'编解码器无法解码位置4276中的字节0xa0:无效的起始字节

Question

根据SEC,数据集以单一编码提供,如下所示:

制表符分隔值(.txt):utf-8,制表符分隔,\n-终止行,第一行包含小写字段名称.

我目前的代码:

import csv

with open('txt.tsv') as tsvfile:
    reader = csv.DictReader(tsvfile, dialect='excel-tab')
    for row in reader:
        print(row)

所有尝试都以以下错误消息结束:

'utf-8'编解码器无法解码位置4276中的字节0xa0:无效的起始字节

我有点迷茫.谁能帮我？提前谢谢了.

Answer 1

文件中的编码是'windows-1252'.使用:

open('txt.tsv', encoding='windows-1252')