如何使用 JSOUP 解析 [电子邮件保护] 数据

Ton*_*ton 2 email parsing jsoup

有没有办法通过 JSOUP 解析受这段代码保护的电子邮件地址:

<a href="/cdn-cgi/l/email-protection" class="__cf_email__" data-cfemail="29484e4a404a4c50404469484e4a404a4c504044074a4644">[email&#160;protected]</a>
Run Code Online (Sandbox Code Playgroud)

使用标准解析时,elements.select(".email").text();它返回[email protected]. 我试图谷歌这个,但发现了很多不相关的信息。

Ble*_*der 5

通过将电子邮件地址中的每个字符与一些随机生成的第一个字节进行异或来“加密”电子邮件地址。将十六进制字符串解码为字节数组,并将所有字节与第一个字节进行异或以解密地址。

例如(在 Python 中):

In [1]: cfemail = '29484e4a404a4c50404469484e4a404a4c504044074a4644'

In [2]: encoded_bytes = bytes.fromhex(cfemail)

In [3]: encoded_bytes
Out[3]: b')HNJ@JLP@DiHNJ@JLP@D\x07JFD'

In [4]: bytes(byte ^ encoded_bytes[0] for byte in encoded_bytes[1:])
Out[4]: b'agciceyim@agciceyim.com'
Run Code Online (Sandbox Code Playgroud)