Java的.比较网页结构(dom)的相似性.

cun*_*aya 6 html java dom similarity

是否有一个库(用于java)比较网页之间的相似性(HTML,dom相似度)?

在我的应用程序中,我想分类网站的链接.例如:( group 1: Product detail page group 2: Category page用于在线购物网站等).

对于这样的分类html结构(dom)相似性是我认为最好的方式.请帮忙解决这个问题.

Víc*_*ero 1

不完全符合您的要求,但如果 HTMl 是 XML 有效的,您可以使用XMLUnit,与它比较相似性非常简单。