我正在尝试read_csv在 Pandas 中使用从 FTP 服务器读取压缩文件。根据需要,zip 文件仅包含一个文件。
这是我的代码:
pd.read_csv('ftp://ftp.fec.gov/FEC/2016/cn16.zip', compression='zip')
Run Code Online (Sandbox Code Playgroud)
我收到此错误:
AttributeError: addinfourl instance has no attribute 'seek'
Run Code Online (Sandbox Code Playgroud)
我在 pandas 18.1 和 19.0 中都收到此错误。我错过了什么,或者这可能是一个错误?
我在文件夹中的几个 zip 文件中有几个 csv 文件,例如:
它们位于文件夹路径中C:/Folder/,当我在文件夹中加载普通 csv 文件时,我使用以下代码:
import glob
import pandas as pd
files = glob.glob("C/folder/*.csv")
dfs = [pd.read_csv(f, header=None, sep=";") for f in files]
df = pd.concat(dfs,ignore_index=True)
Run Code Online (Sandbox Code Playgroud)
接下来是这篇文章:Reading csv zipped files in python
zip 中的一个 csv 的工作方式如下:
import pandas as pd
import zipfile
zf = zipfile.ZipFile('C:/Users/Desktop/THEZIPFILE.zip')
df = pd.read_csv(zf.open('intfile.csv'))
Run Code Online (Sandbox Code Playgroud)
知道如何为我优化这个循环吗?