Luc*_*ang 8 opengraph facebook-graph-api facebook-opengraph
以前有关于此的帖子在网络上,但是所提出的解决方案都没有实际适用于我的场景.
我有一个子页面,它们都有自己独特的og标签,以及一个带有自己的og标签的父根域页面,所有这些都可以被Facebook抓取,这样人们就可以在发布时看到描述/图像.
但是,当我在框中发布我的孩子网址时,结果明显证明facebook已经抓取了父网页.甚至"看到我们的刮板看到的确切"页面也确认了这一点,因为它只显示了父模板.
这是fb's scrapper的链接:https://developers.facebook.com/tools/debug
以下是根域html模板中的og标记:假设父文件是www.me.com假设有一个孩子是www.me.com/path/path
<head> ...
<meta name="keywords" content="...">
<meta name="description" content="..." />
<meta property="fb:app_id" content="..."/>
<meta property="og:site_name" content="..." />
<meta property="og:type" content="website" />
<meta property="og:title" content="..." />
<meta property="og:image" content="..." />
<meta property="og:description" content="..." />
<meta property="og:url" content="http://www.me.com" />
Run Code Online (Sandbox Code Playgroud)
以下是子html模板中的og标记:
<head> ...
<meta name="keywords" content="...">
<meta name="description" content="..." />
<meta property="fb:app_id" content="..."/>
<meta property="og:site_name" content="..." />
<meta property="og:type" content="article" />
<meta property="og:title" content="..." />
<meta property="og:image" content="..." />
<meta property="og:description" content="..." />
<meta property="og:url" content="http://www.me.com/path/path" />
Run Code Online (Sandbox Code Playgroud)
这是非常令人沮丧的,因为我已经尝试删除和添加许多不同组合的标签,每次,www.me.com父母被抓取,而孩子被忽略!
我尝试模仿其他网站的标签的顺序,这个功能像cnn.com一样工作,但是我仍然拒绝抓住孩子..
有帮助吗?谢谢.
在终于注意到一些奇怪的提示后,我解决了这个问题。我正在处理的网站已设置,因此当且仅当尚未设置特定 cookie 时,第一个页面视图才会重定向到启动页面。
因此,Facebook 爬虫每次都会访问该页面。但这并不明显,因为启动页面继承了很多内容,并且看起来就像常规子页面之一。
多么不幸且耗时的错误。
| 归档时间: |
|
| 查看次数: |
1544 次 |
| 最近记录: |