SharePoint 2010搜索中的爬网程序影响规则和爬网规则之间有何区别?

Ybb*_*est 4 sharepoint search sharepoint-2010

SharePoint 2010搜索中的爬网程序影响规则和爬网规则之间有何区别?

Tom*_*ort 8

爬网程序影响规则定义Windows SharePoint Services帮助搜索服务在爬网期间从Web站点请求文档的速率.速率可以定义为请求的同时文档数或请求之间的延迟.在没有爬虫影响规则的情况下,请求的文档数量从5到16,具体取决于硬件资源.

您可以使用爬网程序影响规则来修改在爬网时放置在网站上的负载.

当您要从特定路径爬网内容时,爬网规则使您能够设置企业搜索索引引擎的行为.通过使用这些规则,您可以:

  • 防止特定路径中的内容被爬网.

例如,在内容源指向URL路径(例如http://www.microsoft.com/)的情况下,但您要阻止来自"downloads"子目录的内容http://www.microsoft.com/downloads / from crawled,您将为URL设置规则,行为设置为从该子目录中排除内容.

  • 指示应该爬网否则将从爬网中排除的特定路径.

使用前面的方案,如果下载目录包含应包含在爬网中的名为"content"的目录,则应为以下URL创建爬网规则,并将行为设置为包含"content"子目录http:// www.microsoft.com/downloads/content.