一个大型生物研究项目选择通过 https 提供其档案:
https://tcga-data.nci.nih.gov/tcgafiles/ftp_auth/distro_ftpusers/anonymous/tumor/
不幸的是,这些目录的内容似乎没有清单,所以我只想构建一个。我想获取整个目录树的文件名。有没有关于如何做到这一点的建议?我可以在 perl/python/R/etc 中写一些东西。以递归方式抓取 index.html 文件,但我认为 wget 可能有一些咒语可以让我获得文件名,但我还没有找到。