小编Tom*_*hon的帖子

使用 Paramiko 将文件从 SFTP 传输到 S3

我正在使用 Paramiko 访问远程 SFTP 文件夹,并且尝试编写代码将文件从 SFTP 中的路径传输到 AWS S3 存储桶(使用文件元数据检查其上次修改日期的简单逻辑)。我已经使用 Boto3 设置了与 S3 的连接,但我似乎仍然无法编写一个工作代码来传输文件而不先将它们下载到本地目录。这是我使用 Paramiko 的getfo()方法尝试的一些代码。但这不起作用。

for f in files:
    # get last modified from file metadata
    last_modified = sftp.stat(remote_path + f).st_mtime
    last_modified_date = datetime.fromtimestamp(last_modified).date()
    if last_modified_date > date_limit:  # check limit
       print('getting ' + f)
       full_path = f"{folder_path}{f}"
       fo = sftp.getfo(remote_path + f,f)
       s3_conn.put_object(Body=fo,Bucket=s3_bucket, Key=full_path)
Run Code Online (Sandbox Code Playgroud)

谢谢你!

python sftp amazon-s3 paramiko boto3

5
推荐指数
1
解决办法
9403
查看次数

如何计算多个标记化单词列表中 10 个最常见的单词

我有一个数据集,其中包含很多标记化单词列表。例如:

['apple','banana','tomato']
['tomato','tree','pikachu']
Run Code Online (Sandbox Code Playgroud)

我有大约 40k 个这样的列表,我想从所有 40k 个列表中统计 10 个最常见的单词。

有人有什么想法吗?

python nlp count cpu-word

3
推荐指数
1
解决办法
777
查看次数

标签 统计

python ×2

amazon-s3 ×1

boto3 ×1

count ×1

cpu-word ×1

nlp ×1

paramiko ×1

sftp ×1