Set*_*uth 3 iis coldfusion googlebot cfc http-status-code-404
几个月来,我们的IIS/ColdFusion服务器在Google抓取工具扫描期间抛出了404错误.通常很容易跟踪这些,但在这种情况下,谷歌正在尝试扫描我们的CFC文件.这些文件确实存在,但它们不会暴露给Internet - 仅暴露给ColdFusion服务器.尽管如此,谷歌正在我们网站的某个地方看到与CFC的链接,并且正在努力关注它们.
下面是在404的一个中转储我们的CGI结构. baseCFC是CF映射到D:\Domains\[domain]\cfc.baseCFC源代码中的所有引用都在<cfajaxproxy>标记中,或者CreateObject()在Application.CFC中调用(下面的示例).
也许这是一个重要的线索:baseCFC指的是D:\Domains\[domain]\cfc,谷歌正试图达到D:\Domains\[domain]\www\baseCFC,这是我们网站的主目录.显然,Google将其baseCFC视为服务器上的普通(未映射)目录,并希望对其进行扫描.

以下是baseCFC我们的代码中两种类型的引用的示例:
<cfajaxproxy>:
<cfajaxproxy cfc="baseCFC.Misc" jsclassname="ajxMisc">
Run Code Online (Sandbox Code Playgroud)
的CreateObject():
<cfscript>
request.Misc = CreateObject( "component", "baseCFC.Misc" );
</cfscript>
Run Code Online (Sandbox Code Playgroud)
我们如何解决这些与CFC相关的404错误?谢谢!
nos*_*leg 12
创建的javascript cfajaxproxy包括cfc的位置.查看页面的来源,您应该能够找到该字符串'/baseCFC/Statement.cfc'.这就是谷歌找到它们的方式.
让Google忽略它们的一种快捷方法是修改您的robots.txt文件以排除baseCFC"目录".
User-Agent: *
Disallow: /baseCFC/
Run Code Online (Sandbox Code Playgroud)