我正在尝试使用此函数将多个 CSV 文件合并为一个:
import glob
path = r'/content/drive/My Drive/DatiAirQuality/MI_Air_Quality/data'
all_files = glob.glob(path + "/*.csv")
li = []
for filename in all_files:
df = pd.read_csv(filename, index_col=None, header=0)
li.append(df)
frame = pd.concat(li, axis=0, ignore_index=True)
Run Code Online (Sandbox Code Playgroud)
但我收到此错误:“utf-8”编解码器无法解码位置 0 中的字节 0xb5:无效的起始字节
这是回溯:
8 for filename in all_files:
----> 9 df = pd.read_csv(filename, index_col=None,
header=0)
10 li.append(df)
11
Run Code Online (Sandbox Code Playgroud)
感谢你。
尝试指定这个:
df = pd.read_csv(filename, index_col=None, header=0, encoding='latin-1')
编码latin-1很神奇——它永远不会失败。看看你会得到什么。如果这足够好 - 那么就可以了。
如果没有,您必须找出 CSV 文件实际使用的编码。您可以尝试多种不同的编码,直到答案看起来不错为止。