小编etj*_*tjk的帖子

从 FTP 服务器上的 ZIP 存档读取文件，无需下载到本地系统

我在 FTP 服务器上的目标文件是 ZIP 文件，.CSV 位于更远的两个文件夹中。

我如何才能使用 BytesIO 让 pandas 读取 csv 而无需下载它？

这是我到目前为止所拥有的：

ftp = FTP('FTP_SERVER')
ftp.login('USERNAME', 'PASSWORD')
flo = BytesIO()
ftp.retrbinary('RETR /ParentZipFolder.zip', flo.write)
flo.seek(0)

Run Code Online (Sandbox Code Playgroud)

作为flo我感兴趣的 BytesIO 对象，我如何能够在对象内向下导航几个文件夹，以允许 pandas 读取我的 .csv 文件？这还有必要吗？

python ftp ftplib bytesio pandas

etj*_*tjk

2020 07-24

5
推荐指数

1
解决办法

1069
查看次数

.groupby 和 .fillna 与中位数

# Create a groupby object: by_sex_class
by_sex_class = titanic.groupby(["sex","pclass"]).count()

# Write a function that imputes median
def impute_median(series):
    return series.fillna(series.median())

# Impute age and assign to titanic['age']
titanic.age = by_sex_class["age"].transform(impute_median)

# Print the output of titanic.tail(10)
print(titanic.tail(10))

Run Code Online (Sandbox Code Playgroud)

我不清楚我们如何将修改（分组）的 df, by_sex_class 中的 [“age”] 列分配给原始（未分组）的 df, titanic。

任务会不会很混乱？

预先感谢您的解释。

python dataframe pandas

etj*_*tjk

2018 11-01

2
推荐指数

1
解决办法

2079
查看次数