仅从网页请求元标记

tys*_*skr 2 javascript meta http web-scraping

有没有办法只需要HTML页面的头部而无需下载完整的网页?我只对描述,关键字和标题(标签)等元标记感兴趣.

概括是否有任何HTTP方法可用于仅从服务器请求特定标签而无需下载整个网页?

请告诉我.

Cod*_*ter 6

您正在寻找的东西是在HTML级别定义的,在HTTP层之上的几层.所以不,没有万无一失的方法只能从HTML页面请求某些标签.

鉴于这些标签必然存在于<head>页面的部分中,您可以在遇到</head>标签后停止阅读响应- 如果HTML格式正确.


Que*_*tin 5

没有.

最接近的HTTP是Range标头,它允许您从支持它的服务器请求特定字节.

问题是您无法可靠地知道文档的head部分在请求之前将占用多少字节.