抓取器解码html实体?

Rau*_*net 3 html seo entities web-crawler

我想知道爬虫和机器人是否可以解码html实体,例如在我的html中我有类似的东西:

salariés
Run Code Online (Sandbox Code Playgroud)

他们这样读过吗?或类似的东西:

salariés
Run Code Online (Sandbox Code Playgroud)

哪个选项更适合SEO?

Pek*_*ica 5

我会说你可以放心地假设HTML实体被正确解码了.它们是有效的HTML,而不解码它们的爬虫最终会有大量破碎的内容.