如何在使用 selenium 检查网站时从 Linkedin 的帖子中获取准确的日期?

Jac*_*tek 11 selenium web-scraping linkedin-api

我正在使用 selenium chrome 驱动程序来刮擦 Linkedin 的个人资料。我正在为我的帖子进行分析。这是从 Linkedin 的帖子中以“dd.mm.yyyy”格式而不是“1 个月前”、“2 周前”格式获取确切日期的方法吗?

请帮忙,雅切克

Oll*_*oyd 32

我解码了帖子 ID 以找到时间戳。方法和(js)代码在这里:https://github.com/Ollie-Boyd/Linkedin-post-timestamp-extractor

从 19 位 Linkedin 帖子 ID(经过一番试验和错误)中,我发现我们可以将帖子 ID 转换为二进制,然后将前 41 位二进制位转换为十进制,以给出以毫秒为单位的 UNIX 时间戳。

  • https://ollie-boyd.github.io/Linkedin-post-timestamp-extractor/ 是该表单的工作演示的位置。谢谢! (6认同)

小智 0

不是真的,如果你检查 html,你会发现你有一个基本字符串:

在此输入图像描述

解决您的问题的唯一方法是创建一个方法:

  1. 提取当前日期(根据需要格式化)
  2. 从 LI 中摘录经过了多少时间
  3. 根据提取的数据(小时、天、周、月、年)创建逻辑,并使用提取的当前日期进行数学计算。这应该不会太困难,因为任何编程语言都有可以帮助您的库。