小编sea*_*avi的帖子

从 http 目录递归获取所有文件名(非内容)

一个大型生物研究项目选择通过 https 提供其档案:

https://tcga-data.nci.nih.gov/tcgafiles/ftp_auth/distro_ftpusers/anonymous/tumor/

不幸的是,这些目录的内容似乎没有清单,所以我只想构建一个。我想获取整个目录树的文件名。有没有关于如何做到这一点的建议?我可以在 perl/python/R/etc 中写一些东西。以递归方式抓取 index.html 文件,但我认为 wget 可能有一些咒语可以让我获得文件名,但我还没有找到。

https wget

9
推荐指数
2
解决办法
2万
查看次数

标签 统计

https ×1

wget ×1