我在远程 FTP 服务器上有很多 zip 存档,它们的大小高达 20TB。我只需要这些 zip 存档中的文件名,以便我可以将它们插入到我的 Python 脚本中。
有没有什么方法可以只获取文件名而不实际下载文件并将它们解压到我的本地计算机上?如果是这样,有人可以指导我找到正确的库/包吗?
csv文件如下所示:
a,b,c
1,2,3,
4,5,6,
a,b,c,
Run Code Online (Sandbox Code Playgroud)
当我尝试使用pandas read_csv读取此文件时,数据框如下所示:
|---------------|
| | a | b | c |
|---------------|
| 1 | 2 | 3 | |
| 4 | 5 | 6 | |
| a | b | c | |
|---------------|
Run Code Online (Sandbox Code Playgroud)
我认为数据中的问题是:它看起来像1,2,3,space \n和pandas认为有4列而第一列是未命名的.有什么方法可以改为:
|-----------|
| a | b | c |
|-----------|
| 1 | 2 | 3 |
| 4 | 5 | 6 |
| a | b | c |
|-----------|
Run Code Online (Sandbox Code Playgroud)
这些文件大约有5000万行,并且有很多文件.有没有办法以最短的运行时间做到这一点?
我编写了不同的 python 代码来反转给定的字符串。但是,无法弄清楚其中哪一个是有效的。有人可以使用时间和空间复杂度指出这些算法之间的差异吗?
def reverse_1(s):
result = ""
for i in s :
result = i + result
return result
def reverse_2(s):
return s[::-1]
Run Code Online (Sandbox Code Playgroud)
有已经有一些解决方案在那里,但我无法找出时间和空间复杂度。我想知道需要多少空间s[::-1]?
python algorithm time-complexity space-complexity data-structures
我有三个任务t1,t2,t3.例如,每个任务输出是下一个任务输入,t1输出是t2输入.完成后t1,我得到一个空的输出文件夹(这可能发生在我的情况下,它可以接受并标记t1为成功)但由于没有文件而t2无法获取输出t1.如果没有文件,我想标记t2并t3成功.我怎样才能跳过接下来的两个任务.
我经历了气流文档和其他文章遇到传感器和戳方法.但是,不知道如何继续这样做.