我使用60000的db.fetch.interval.default设置Nutch,这样我每天都可以爬行.如果我不这样做,那么当我第二天爬行时,它甚至都不会看我的网站.但是当我第二天抓取时,昨天获取的每个页面都会获得一个200响应代码,表明它没有在"If-Modified-Since"中使用前一天的日期.它不应该跳过提取未更改的页面吗?有没有办法让它做到这一点?我注意到Fetcher.java中有一个ProtocolStatus.NOT_MODIFIED,所以我认为它应该可以做到这一点,不应该吗?
顺便说一句,这是从当前主干的conf/nutch-default.xml剪切和粘贴的:
<!-- web db properties -->
<property>
<name>db.default.fetch.interval</name>
<value>30</value>
<description>(DEPRECATED) The default number of days between re-fetches of a page.
</description>
</property>
<property>
<name>db.fetch.interval.default</name>
<value>2592000</value>
<description>The default number of seconds between re-fetches of a page (30 days).
</description>
</property>
Run Code Online (Sandbox Code Playgroud) 我想要一行类似于下面的代码:
var name = $('#input-name').attr("value");
Run Code Online (Sandbox Code Playgroud)
但是,不保证id'input-name'存在.如何检查它的存在,以便赋值不会引发错误?
我以前从未见过这个,我一直都知道有GET或POST.我找不到任何好的文件.
GET通过URL发送变量.POST通过文件正文发送?
HEAD做什么?
它不经常使用,我是否正确?
W3schools.com甚至没有提到它.
我有一个字符串,其中包含一个时间戳(yyyy-mm-dd hh:mm:ss).我可以CultureInfo根据我得到的其他信息创建一个对象.因此,我知道时间戳所在的国家/地区.时间戳不是UTC/GMT.
假设时间戳来自Indonesia (new CultureInfo("id-ID")),意味着该字符串是由下面的代码或类似代码创建的.
DateTime.Now.ToString("yyyy-MM-dd hh:mm:ss");
Run Code Online (Sandbox Code Playgroud)
这意味着该字符串包含印度尼西亚当地时间.我知道我的时区,但我不知道如何将印度尼西亚时间转换为UTC/GMT,所以我可以使用UTC/GMT对象TimeZoneInfo.我自己的时区可能在同一时区,也可能不在同一时区.
有没有,这个信息是连接的?
CultureInfo 有很多属性,肯定有些属性可以用来获得时区,somwhere?
我可能会补充一点,我发现整个系统非常混乱,所以我觉得我认为事情是如何运作的.
我需要网页内容.我需要从中获取一些数据.看起来像:
<div class ="deg"> DATA </ div>
据我所知,我必须使用正则表达式,但我不能选择一个.
我尝试了下面的代码,但没有任何结果.请纠正我:
regexHandler = re.compile('(<div class="deg">(?P<div class="deg">.*?)</div>)')
result = regexHandler.search( pageData )
Run Code Online (Sandbox Code Playgroud) 在我看来,我使用fields_for来显示关系表的表单数据.但是,此表单的一部分将有可供选择的列表.我看到有标签,text_field,text_area助手为的form_for和fields_for助手将在从已经填充模型对象所需的信息填写...但对于一个选择列表助手将做?
当我具有一对多关系时,这将特别有用,因为fields_for遍历模型对象中已经存在的每个项目并使用索引显示它.
有这样的事吗?
在memcached网站上,它说memcached是一个分布式内存缓存.这意味着它可以跨多个服务器运行并保持某种一致性.当我在谷歌应用引擎中发出请求时,同一服务器很可能会为同一个实体组中的请求提供服务.
我的问题是,有两个服务器为我的请求提供服务,这两个服务器的memcached视图是一样的吗?也就是说,我把memcached放在一个服务器中的东西反映在另一个服务器的memcached实例中,还是这两个完全独立的memcached实例(每个服务器一个)?
具体来说,我希望每个服务器实际运行自己的memcached实例(在其他memcached实例中没有复制).如果这两个memcached实例相互更新有关对它们所做的更改,是否有办法禁用它?
如果这些问题很愚蠢,我很抱歉,因为我刚刚开始阅读它,但这些是我遇到的初步问题.谢谢.
我正在试图弄清楚如何在Send-MailMessagegmail中使用PowerShell V2 .
这是我到目前为止所拥有的.
$ss = New-Object Security.SecureString
foreach ($ch in "password".ToCharArray())
{
$ss.AppendChar($ch)
}
$cred = New-Object Management.Automation.PSCredential "uid@domain.com", $ss
Send-MailMessage -SmtpServer smtp.gmail.com -UseSsl -Credential $cred -Body...
Run Code Online (Sandbox Code Playgroud)
我收到以下错误
Send-MailMessage : The SMTP server requires a secure connection or the client was not authenticated. The server response was: 5.5.1 Authentication Required. Learn
more at
At foo.ps1:18 char:21
+ Send-MailMessage <<<< `
+ CategoryInfo : InvalidOperation: (System.Net.Mail.SmtpClient:SmtpClient) [Send-MailMessage], SmtpException
+ FullyQualifiedErrorId : SmtpException,Microsoft.PowerShell.Commands.SendMailMessage
Run Code Online (Sandbox Code Playgroud)
我做错了什么,或者还Send-MailMessage没有完全出炉(我在使用CTP 3)?
一些额外的限制
我尝试在这个纹理中绘制一个字符串:
http://picasaweb.google.it/lh/photo/LkYWBv_S_9v2d6BAfbrhag?feat=directlink
但绿色数字似乎垂直翻转.我用这种方式创建了我的上下文:
colorSpace = CGColorSpaceCreateDeviceRGB();
data = malloc(height * width * 4);
context = CGBitmapContextCreate(data, width, height, 8, 4 * width, colorSpace, kCGImageAlphaPremultipliedLast | kCGBitmapByteOrder32Big);
Run Code Online (Sandbox Code Playgroud)
我画了字符串:
UIGraphicsPushContext(context);
for(int i=0;i<packs.size();++i)
{
CGPoint points[4] =
{
gltextures[i].texCoords[0] * size.width, //0
gltextures[i].texCoords[1] * size.height, //1
gltextures[i].texCoords[2] * size.width, //2
gltextures[i].texCoords[3] * size.height, //3
gltextures[i].texCoords[4] * size.width, //4
gltextures[i].texCoords[5] * size.height, //5
gltextures[i].texCoords[6] * size.width, //6
gltextures[i].texCoords[7] * size.height //7
};
CGRect debugRect = CGRectMake
(
gltextures[i].texCoords[0] * size.width,
gltextures[i].texCoords[1] * size.height,
gltextures[i].width, …Run Code Online (Sandbox Code Playgroud) 有什么理由不使用iframe吗?我目前使用它从不同的服务器(注册页面 - 分布式应用程序的一部分)加载页面,以提供无缝体验.使用iframe被认为是不好的做法还是使用OK?
html ×2
c# ×1
cultureinfo ×1
gmail ×1
helper ×1
iframe ×1
iphone ×1
javascript ×1
jquery ×1
memcached ×1
nutch ×1
powershell ×1
python ×1
regex ×1
security ×1
select ×1
timezone ×1
web-crawler ×1
webforms ×1