dat*_*.io 20 html opengraph pinterest
几个月来我们一直在努力解决这个问题但却无济于事.Pinterest上的丰富引脚曾经为我们的网站工作,但突然他们停止工作,一个接一个的所有丰富的引脚(可点击的标题和价格)消失了我们的网站的引脚.
例如,使用此产品,我们在HTML代码的head部分中清楚地预先显示了打开的图形信息:
<meta property="og:type" content="product" />
<meta property="og:title" content="Backless Gray Lace Tulle Flower Girl Dress with Big Bow" />
<meta property="og:description" content="This dress is made of high quality lace and tulle fabric; Unique Cross back with straight neckline in the front; Big ... Shop now use NYC2018 for 9% off TODAY!" />
<meta property="og:url" content="http://www.princessly.com/backless-gray-lace-tulle-flower-girl-dress-with-big-bow.html" />
<meta property="og:site_name" content="Princessly.com" />
<meta property="og:price:amount" content="49.62" />
<meta property="og:price:currency" content="USD" />
<meta property="og:availability" content="instock" />
Run Code Online (Sandbox Code Playgroud)
按他们的丰富针的要求在这里.半年前我们首次在我们的网站上实施它时,这一切都很好.不幸的是由于某种原因它在一个月前停止工作.请参见引脚页面.它不再显示这些丰富的引脚信息.
当我们尝试使用富引脚验证器(https://developers.pinterest.com/tools/url-debugger/)的产品页面时,它仍然无法正常工作,并且不断为我们测试的每个URL提供此错误:
我们无法从您的网址中检索任何数据.
像这样:http://www.princessly.com/pinterest_error.png
这不是一个非常有用的错误消息.我们不确定他们是否无法访问该页面(http代码?空白页面或其他什么?)或者只是在那里找不到任何打开的图形信息.
我们尝试了一切围绕网站管理员论坛并寻求Pinterest官方支持的内容,除了向我们提供我们已经知道的文档并指责我们的服务器阻止访问他们的机器人之外基本上没有帮助但是在与我们的托管团队多次确认后,没有错误关于Pinterest.com访问我们的网站:
54.85.173.173 - - [11/Oct/2016:21:22:00 -0500] "GET /u-back-ivory-cotton-ruffle-neckline-flower-girl-dress.html HTTP/1.1" 200 22477 "-" "Pinterest/0.2 (+http://www.pinterest.com/)"
54.227.228.14 - - [11/Oct/2016:21:27:20 -0500] "GET /u-back-ivory-cotton-ruffle-neckline-flower-girl-dress.html HTTP/1.1" 200 22477 "-" "Pinterest/0.2 (+http://www.pinterest.com/)"
52.87.185.68 - - [11/Oct/2016:21:28:06 -0500] "GET /u-back-ivory-cotton-ruffle-neckline-flower-girl-dress.html HTTP/1.1" 200 22477 "-" "Pinterest/0.2 (+http://www.pinterest.com/)"
Run Code Online (Sandbox Code Playgroud)
由于我们是女性产品商家,Pinterest意味着销售额的一大部分.由于富销消失,我们已经看到相当大的收入下降.我们认为这个问题在我们发言时耗费了真正的金钱.
我们绝望,认为我们应该在这里试试运气.不确定这是否适合编程问题但它确实涉及HTML和Open Graph的代码以及提供开发人员API的主要社交网络之一.
由于我们无法掌握Pinterest机器人以及它如何看待我们的页面,因此我们调试它的方式似乎非常有限.
知道如何发生这种情况以及如何调试和修复它?这里的任何Pinterest员工都可以提供一些见解吗?谢谢!
以下是我在过去24小时内通过indexly.php记录的HTTP用户代理,其中包含"Pinterest":http://www.princessly.com/Pinterest.txt
我的主人WiredTree很友好地再次为我检查这一切.似乎Pinterest机器人确实能够访问我的网站没问题.
在检查站点"princessly.com"的访问日志时,我可以看到从"Pinterest"到"Princessly.com"站点的成功访问.请参阅日志中的代码段.
======
194.103.189.40 - - [15/Nov/2016:03:32:31 -0600]"GET /skin/frontend/default/forest_fashion/images/bkg_btn_sprite.png HTTP/1.1"200 2503" http://www.princessly .com/skin/frontend/default/forest_fashion/css/styles.css ""Pinterest/0.2 + http://pinterest.com/"194.103.189.40 - - [15/Nov/2016:03:32:31 -0600 ]"GET /skin/frontend/default/forest_fashion/images/tabs_border.gif HTTP/1.1"200 43" http://www.princessly.com/skin/frontend/default/forest_fashion/css/styles.css ""Pinterest /0.2 + http://pinterest.com/"194.103.189.40 - - [15/Nov/2016:03:32:31 -0600]"GET /skin/frontend/default/forest_fashion/images/pager_bg.gif HTTP/1.1"200 102" http://www.princessly.com/skin/frontend/default/forest_fashion/css/styles.css ""Pinterest/0.2 + http://pinterest.com/ "
======
有什么方法可以找到我可以检测为HTTP用户代理的Pinterest机器人的名称吗?
从日志中我可以看到Pinterest bot标签是"Pinterest/0.2 + http://pinterest.com ".
- 我们能否知道Pinterest bot发出的请求是否超时?
我已经检查了Apache日志中注意到Pinterest访问的IP地址,我找不到任何超时错误.
- 我们如何知道我们是否阻止AWS请求?
在检查时,我看不到网站"Princessly.com"的任何阻止规则设置.我检查了网站的.htaccess文件和robots.txt文件.我现在已根据您提供的链接将AWS IP地址范围列入白名单.
您能否请立即查看详细信息,如果有任何Pinterest用户面板或其他详细信息,请告诉我们,以便我们深入挖掘.
根据@Mackan的建议,我创建了几个完全相同的裸小页面,并使用正确的开放图形信息,并将它们上传到几个不同的站点.我正在录制访问该页面的所有PHP USER AGENT:
网站IP:173.199.151.128
http://www.princessly.com/ivory-lace-tulle-wedding-flower-girl-dress-with-sheer-neck-TEST123.php
- 失败
网站IP:173.199.151.128
- 失败
网站IP:173.199.151.130
http://www.bintley.com/ivory-lace-tulle-wedding-flower-girl-dress-with-sheer-neck-TEST123.php
- 失败
https://www.thedataplanet.com/ivory-lace-tulle-wedding-flower-girl-dress-with-sheer-neck-TEST123.php
- 成功
http://www.formkid.com/ivory-lace-tulle-wedding-flower-girl-dress-with-sheer-neck-TEST123.php
- 成功
在使用富引脚验证器进行测试后,它似乎是一个服务器问题.该请求永远不会到达Princessly.com服务器上所有站点的PHP文件.
WiredTree的支持非常友好,可以帮助我找到罪魁祸首,但在通过5名支持人员转移之后,到目前为止没有任何希望.我们已经完成了.htaccess,Apache conf,modSecurity,防火墙,白名单Pinterest IP,AWS IP等等.没有任何效果.
这真的很奇怪.
甚至更奇怪的是,如果你看一下http://www.princessly.com/Pinterest_agents.txt,你会发现那里有"Pinterest/0.2(+ http://www.pinterest.com/)"的INDEED条目.
但是,如果您进行手动测试,它将失败并且根本不记录访问权限.
也许是间歇性的打破.
这几乎是在量子物理领域,我现在不知道该怎么做,除了最后的手段是订购和配置新服务器并迁移Princessly.com,看看它是怎么回事.
你的想法?
使用https://developers.pinterest.com/tools/url-debugger/调试问题后,问题似乎源于服务器端。
如果您看到“我们无法从您的网址检索任何数据”,则在我们在您的网站上创建 Pin 图之前,Pinterest 可能会超时。不幸的是,这不是我们可以解决的问题,并且通常在网站速度缓慢时发生。如果您的站点阻止 Amazon Web Services (AWS) 请求,也会出现此错误。在申请 Rich Pin 图之前,您必须删除此块。
创建一些“最小但有效”的页面并通过验证器运行它们使问题更加清晰,但不幸的是并没有解决它。这要么是本地服务器 (Apache) 的问题,要么可能是 pinterest 机器人的问题。
Pinterest 机器人似乎连接服务器正常,但验证器无法解析或到达端点。由于最少的示例会在大约不到一秒的时间内返回,并且包含满足 Pinterests 要求的最低限度的示例,因此很明显问题不在您的代码中。
将解决方案迁移到另一台主机似乎已经解决了问题。
编辑