小编etj*_*tjk的帖子

从 FTP 服务器上的 ZIP 存档读取文件,无需下载到本地系统

我在 FTP 服务器上的目标文件是 ZIP 文件,.CSV 位于更远的两个文件夹中。

我如何才能使用 BytesIO 让 pandas 读取 csv 而无需下载它?

这是我到目前为止所拥有的:

ftp = FTP('FTP_SERVER')
ftp.login('USERNAME', 'PASSWORD')
flo = BytesIO()
ftp.retrbinary('RETR /ParentZipFolder.zip', flo.write)
flo.seek(0)
Run Code Online (Sandbox Code Playgroud)

作为flo我感兴趣的 BytesIO 对象,我如何能够在对象内向下导航几个文件夹,以允许 pandas 读取我的 .csv 文件?这还有必要吗?

python ftp ftplib bytesio pandas

5
推荐指数
1
解决办法
1069
查看次数

.groupby 和 .fillna 与中位数

# Create a groupby object: by_sex_class
by_sex_class = titanic.groupby(["sex","pclass"]).count()

# Write a function that imputes median
def impute_median(series):
    return series.fillna(series.median())

# Impute age and assign to titanic['age']
titanic.age = by_sex_class["age"].transform(impute_median)

# Print the output of titanic.tail(10)
print(titanic.tail(10))
Run Code Online (Sandbox Code Playgroud)

我不清楚我们如何将修改(分组)的 df, by_sex_class 中的 [“age”] 列分配给原始(未分组)的 df, titanic。

任务会不会很混乱?

预先感谢您的解释。

python dataframe pandas

2
推荐指数
1
解决办法
2079
查看次数

将打印功能分配给变量

对于以下代码,在我看来,我们正在将打印功能分配给变量spam。

spam = print('Hello!')
Run Code Online (Sandbox Code Playgroud)

我想知道为什么不打电话给垃圾邮件,打印出来“你好!”?

python

1
推荐指数
1
解决办法
1998
查看次数

标签 统计

python ×3

pandas ×2

bytesio ×1

dataframe ×1

ftp ×1

ftplib ×1