我可以使用robots.txt来阻止某些网址参数吗?

Luc*_*emy 5 robots.txt

在你告诉我"你有什么尝试"和"自己测试"之前,我想指出robots.txt更新非常缓慢我的网站搜索引擎上的任何网站,所以如果你能提供理论体验,那将是值得赞赏的.

例如,是否可以允许:

http://www.example.com
Run Code Online (Sandbox Code Playgroud)

并阻止:

http://www.example.com/?foo=foo
Run Code Online (Sandbox Code Playgroud)

我不太确定.

救命?

Sea*_*son 6

根据维基百科,"robots.txt模式通过简单的子字符串比较匹配",因为GET字符串是一个你应该能够添加的URL:

Disallow: /?foo=foo
Run Code Online (Sandbox Code Playgroud)

或更喜欢的东西

Disallow: /*?* 
Run Code Online (Sandbox Code Playgroud)

禁用所有获取字符串.星号是通配符,因此它匹配任何内容的一个或多个字符.

带动态网址的robots.txt示例.