我有几个Twitter推动的新闻聚合网站.我一直在计划添加我在twitter上找到的文章中的图像.
如果我下载页面并使用<img>标签提取图像,我会得到一堆图像; 并非所有这些都与文章相关.例如,捕获按钮,图标,广告等的图像.如何提取文章附带的图像?我知道有一个解决方案 - Facebook链接共享器做得非常好.
<img>
大额牛
重复:如何在网站中查找和提取"主要"图像
html parsing image-extraction
html ×1
image-extraction ×1
parsing ×1