我正在寻找一种找到以给定tld结尾的“所有”网站的方法。关于如何实现这一点,我有几个想法,但是我不确定实现这一点的最佳/最有效方式是什么。我知道蜘蛛等无法找到无处链接的页面,因此在此示例中,我将不在乎孤立的页面。我想做的是,我想有一个TLD作为我的程序的输入,而我要有一个站点列表作为输出。例如:
# <program> .de
- spiegel.de
- deutsche-bank.de
...
- bild.de
Run Code Online (Sandbox Code Playgroud)
那么实现这一目标的最佳方法是什么?有没有可以帮助我的工具,或者您将如何编程?