如何找到上次更新网页的时间?

gui*_*gui 67 html upload

有没有办法找出自网页更改以来已经过了多少时间?

例如,我有一个托管页面: www.mywebsitenotupdated.com

有没有办法找出这个HTML页面何时上传到服务器?

非常重要,我无法访问服务器; 只是指向网页的链接.

Juk*_*ela 66

不,只是通过访问页面,您无法知道页面上次更新或上次更改或上传到服务器的时间(可能,根据解释,可能是三种不同的东西).

服务器可以(并且应该根据HTTP 1.1协议)发送Last-Modified标头,您可以通过多种方式找到该标头,例如使用Rex Swain的HTTP Viewer.但是,根据协议,这只是"源服务器认为变体上次修改的日期和时间".协议实际上补充说:"此标头字段的确切含义取决于源服务器的实现和原始资源的性质.对于文件,它可能只是文件系统上次修改时间.对于具有动态包含部分的实体,它可能是其组成部分的最后一组最后修改时间.对于数据库网关,它可能是记录的最后更新时间戳.对于虚拟对象,它可能是内部状态最后一次改变."

在实践中,网页通常是从内容管理系统或其他方式动态创建的,并且在这种情况下,Last-Modified标题通常显示创建响应的数据标记,该响应通常非常接近请求的时间.这意味着在这种情况下标题实际上是无用的.

即使在"静态"页面的情况下(服务器只是选择与请求匹配的文件并发送它),Last-Modified日期戳通常仅指示对服务器上文件的最后写入访问.这可能与从备份副本还原文件的时间,或者在服务器上编辑文件而不对内容进行任何更改的时间,或者上载到服务器上的时间有关,可能会替换旧的相同的副本.在这些情况下,假设时间戳在技术上是正确的,它表示页面未被更改的时间(但不一定是上次更改的时间).


小智 53

打开浏览器控制台()并输入以下内容:

javascript:alert(document.lastModified)
Run Code Online (Sandbox Code Playgroud)

  • 你也可以在控制台中打印出来.只需输入document.lastModified即可 (11认同)
  • 你好.当我在控制台中搜索这个时:我得到系统的当前日期和时间:`javascript:alert(document.lastModified)`不是实际日期 (11认同)
  • 下面的答案应该是接受的答案,因为动态页面是动态生成的,并且此命令在该上下文中毫无价值.对于静态页面,它是一个有用的命令(如果您可以确定页面是真正静态的). (6认同)
  • @ raja777m也许你正在尝试这个动态网页 (2认同)

hoo*_*oke 12

还有另一种方法可以找到页面更新,这对某些场合很有用(如果有效:).

如果页面已被Google或Wayback Machine编入索引,您可以尝试找出他们保存的日期(这些方法不适用于任何页面,并且有一些限制,这些都是广泛调查的在这个webmasters.stackexchange 问题的答案.但在许多情况下,他们可以帮助您找出页面更新日期:

  1. Google方式:点击链接https://www.google.com.ua/search?q=site%3Awww.example.com&biw=1855&bih=916&source=lnt&tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000%2Ccd_max% 3A和TBM =
    • 您可以通过所需的任何页面URL更改搜索字段中的文本.
    • 例如,当前的stackoverflow问题页面搜索为我们提供了2014年5月14日的结果 - 这是问题创建日期:在此输入图像描述
  2. Wayback机器方式:通过链接https://web.archive.org/web/*/www.example.com
    • 对于这个stackoverflow页面,wayback机器为我们提供了更多结果:Saved 6 times between June 7, 2014 and November 23, 2016.,您可以查看每个日期的所有已保存副本

  • 回退机器的 API 可让您按存档顺序查看页面所有版本的列表。然后您可以扫描其中的几个以确定该页面何时不再存在。但是您必须拉取每个版本并进行差异检查以查看上次修改时间。 (2认同)
  • 回溯机显示他们的服务上次读取该给定页面的时间,@Rozar Fabien。不是页面上次更新的时间。他们自己也这么说。它对于此目的仍然有用,但日期不准确。 (2认同)