有一种方法可以从谷歌的索引中排除完整的页面.但有没有办法明确地从谷歌的爬行中排除某个网页的某些部分?例如,排除通常包含无关内容的侧栏?
我目前正在通过Google Analytics跟踪多个域,但"查询"报告仍然是空的,因为我必须链接一个网站管理员工具属性.
这对我来说没有任何意义,因为我的多重跟踪配置文件从6个不同的网站提取数据.
有没有办法将所涉及的所有域的所有网站管理员工具查询数据合并到Google多个域跟踪报告中?
在将我的网站提交给Google和Bing时,他们要求我通过(例如)上传文件进行验证.
如果我理解了这个文件,则不应该删除,因为他们定期重新检查并删除它意味着我将失去访问权限并需要再次验证它.
鉴于本网站的来源可在GitHub上公开获取,是否安全/确定将这些验证文件添加到源代码管理中?或者这会增加某种风险?
security version-control google-webmaster-tools bing-webmaster-tools
我想使用https://和非www.URL始终.所以我在htaccess文件中使用了以下代码.但我收到https://hstspreload.org的警告
RewriteCond %{HTTPS} off
RewriteRule .* https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
RewriteCond %{HTTP_HOST} !^www\.
RewriteRule .* https://www.%{HTTP_HOST}%{REQUEST_URI} [L,R=301]
<ifModule mod_headers.c>
Header always set Strict-Transport-Security "max-age=31536000;
includeSubDomains; preload"
</ifModule>
Run Code Online (Sandbox Code Playgroud)
警告信息如下:
警告:
HTTP上不必要的HSTS标头http://mysiteurl.com上的HTTP页面发送HSTS标头.这对HTTP没有影响,应该删除.
请帮我摆脱上述警告.我尝试使用以下代码,但它不起作用#ref.话题
Header always set Strict-Transport-Security "max-age=31536000;
includeSubDomains; preload" env=HTTPS
Run Code Online (Sandbox Code Playgroud) 我希望通过R访问我的Google网站管理员工具的API.
我从这里看到:
http://code.google.com/apis/webmastertools/docs/2.0/reference.html
它需要在https后面获取一个feed并解析它.
有关如何做的任何建议?
我有一个为Google网站站长工具生成XML站点地图的程序(除其他外).
GWT为我提供了一些站点地图的错误,因为URL包含¾,ã<,ã等字符序列.**
GWTs说:
我们要求您的Sitemap文件采用UTF-8编码(通常可以在保存文件时执行此操作).与所有XML文件一样,任何数据值(包括URL)都必须使用字符的实体转义码:&,',",<,>.
特殊字符在XML文件中展开(使用HTML实体).
XML文件片段:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://domain/folder/listing-ã.shtml</loc>
...
Run Code Online (Sandbox Code Playgroud)
我的网址是UTF-8编码的吗?
如果没有,我如何用Java做到这一点?
以下是我的程序中的行,我将URL添加到站点地图:
siteMap.addUrl(StringEscapeUtils.escapeXml(countryName+"/"+twoCharFile.getRelativeFileName().toLowerCase()));
Run Code Online (Sandbox Code Playgroud)
**=我不确定哪些是导致错误的,可能是前两个例子.
我为所有的编辑道歉.
java sitemap encoding character-encoding google-webmaster-tools
我正在使用$_SERVER['HTTP_REFERER'];
,获取推荐人URL.
当我输入谷歌搜索框时 q='some text'
`https://www.google.com.pk/#hl=en&output=search&sclient=psy-ab&q=some text%2Ftestbulkresponse&oq=some text%2Ftestbulkresponse&gs_l=hp.3...15460.24280.1.25007.30.30.0.0.0.0.325.7136.2-27j3.30.0...0.0...1c.1.8.hp.dAvuch3bBg4&psj=1&bav=on.2,or.r_qf.&bvm=bv.44697112,d.ZWU&fp=980e418276b62e8c&biw=1366&bih=595`
Run Code Online (Sandbox Code Playgroud)
但是当我在我的网站上使用as获取此URL时 $_SERVER['HTTP_REFERER'];
在q=null
这样的
`http://www.google.com.pk/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CC0QFjAA&url=http%3A%2F%2Fwww.bulkresponse.com%2Ftestbulkresponse%2Fdashboard.php&ei=r9NbUfv7GcjaOYDdgKgC&usg=AFQjCNF9U_DpJEwupZ0ZLPbjWJ6DQLWZcA&bvm=bv.44697112,d.ZWU`.
Run Code Online (Sandbox Code Playgroud)
因此,我无法在Google中获取搜索关键字,我应该怎么做才能获得搜索关键字?
我一直在抨击这几天,试图弄清楚这是怎么做的.我想从Google网站站长工具中下载CSV,这是我成功完成的.但是,我必须直接传递我希望访问的帐户的用户名和密码.对于网站管理员工具的所有其他方面,我只需要用户登录,然后使用可重复使用的会话令牌从登录中交换令牌.
在获取查询数据时,似乎无法使用此方法.
String next = "http://xyz.domain.com/auth"; //sets page to goto after user log's in so we can pass the token to application
String scope = "http://www.google.com/webmasters/tools/feeds"; // sets the scope of the token
boolean secure = false;
boolean session = true;
String urlFromAuthSub = AuthSubUtil.getRequestUrl(next, scope, secure, session); //generates the URL to forward user to loginto google.
Run Code Online (Sandbox Code Playgroud)
在捕获页面(上面代码中的下一个参数)上,您在成功登录后收到令牌.然后将它换成会话令牌.
String token = "##########################";
String sessionToken = AuthSubUtil.exchangeForSessionToken(token, null);
//store sessionToken for all future use to interact with webmaster for this user. …
Run Code Online (Sandbox Code Playgroud) 我的网站在AngularJS中,所以我最近创建了所有内容的HTML快照,将转义的片段标记添加到我所有页面的头部(meta name ="fragment"content ="!"),然后尝试测试看看如果新设置在网站站长工具中有效.当我查看源代码时,我看到了转义的片段(但是,它被反转)(元内容="!"name ="fragment").我不确定为什么会发生这种情况或者重要的是......
当我提交"以Google抓取"的网址时,网站管理员工具会返回未找到抓取状态.但是,如果我手动将"?_escaped_fragment_ ="添加到我的URL末尾,我将获得成功状态.
所以,我的问题是,这是否与网站管理员工具如何测试网址或我是否设置错误的片段转发有关?
我使用此元标记来使Google搜寻器知道我的网站有两种语言,如此处support.google所建议。
<link rel="alternate" hreflang="x-default" href="http://www.example.com" />
<link rel="alternate" hreflang="de" href="http://www.example.com/de" />
<link rel="alternate" hreflang="en" href="http://www.example.com/en" />
Run Code Online (Sandbox Code Playgroud)
因此,有时的内容example.com
与example.com/de
和example.com
相同example.com/en
。
我使用以下代码检测语言
const lang = (
getLangFromUrl(req.url) ||
getLangFromCookies(req.cookies) ||
getLangFromHeader(req.headers) ||
'de'
);
Run Code Online (Sandbox Code Playgroud)
和谷歌检测到,example.com
并example.com/de
作为重复的页面。
您能告诉我如何正确完成吗?