如何使用Perl通过HTTPS下载文件？

Question

我想通过HTTPS下载大约200个不同的HTML文件,并从每个文件中提取页面标题,并将标题放入文本文档中.

我如何使用Perl使用HTTPS下载文件？我搜索了谷歌,但我没有找到非常有用的信息或例子.

Answer 1

看看HTML :: HeadParser,它是HTML :: Parser发行版的一部分.它将解析HTML标头以提取<title>标记内容.

对于获取HTML内容,有大量可用的CPAN模块.一个这样的模块是LWP :: Curl,它属于libwww-perl系列.在此网站上搜索有关获取HTML的许多讨论以了解更多信息.

要通过HTTPS下载,请查看libwww-perl下的文档.目前在libwww-perl下使用SSL的"标准"方式是通过Crypt :: SSLeay.