从http://mirror.nyi.net/apache//nutch/apache-nutch-1.2-src.zip获取源代码
org.apache.nutch.crawl.Crawl在编辑器中 公开课程。
查找变量Path crawlDb = new Path(dir + "/crawldb");
该变量将提示在哪里替换代码以获得您自己的CustomMySQLCrawl类。
持久性是在这次调用期间发生的:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb因此您应该将其保存到数据库中。此时您可能需要考虑集成 hibernate。
| 归档时间: |
|
| 查看次数: |
2108 次 |
| 最近记录: |