检查 html 文件中的死链接?

Roo*_*ook 4 html url verification

我有一个包含数百个链接的 html 文件,这是我多年来收集的某种研究数据库。检查其中哪一个还活着的最简单方法是什么?

(在 Firefox 中导入是不可能的)

qua*_*ote 5

使用wget。简单、可编写脚本、命令行,并且可在您喜欢的平台上使用,无论是 Unix-ish、Win*、Cygwin 等(请参阅Wikipedia以获取各种版本的链接)。从联机帮助页

--spider
当使用此选项调用时,Wget 将表现为网络蜘蛛,这意味着它不会下载页面,只需检查它们是否在那里。例如,您可以使用 Wget 检查您的书签:

wget --spider --force-html -i bookmarks.html

这个特性需要做更多的工作才能让 Wget 接近真实的网络蜘蛛的功能。

您可能也需要--no-verbose和/或--output-document=file选项。