可以找到或加载主类org.apache.nutch.crawl.InjectorJob

ori*_*ion 8 solr hadoop nutch

我正在使用Linux与Hadoop,Cloudera和HBase.

你能告诉我如何纠正这个错误吗?

错误: could to find or load main class org.apache.nutch.crawl.InjectorJob

以下命令给了我错误:

src/bin/nutch inject crawl/crawldb dmoz/
Run Code Online (Sandbox Code Playgroud)

如果您需要任何其他信息请求我.

cod*_*ama 2

我想你可能错过了一两步。请确认:

  1. 您是否安装了 Apache ANT,然后导航到 nutch 文件夹并输入“ant”?
  2. 您是否设置了环境变量:
    • NUTCH_JAVA_HOME:要使用的 java 实现。覆盖JAVA_HOME.
    • NUTCH_HEAPSIZE:要使用的最大堆量(以 MB 为单位)。默认值为 1000。
    • NUTCH_OPTS:额外的 Java 运行时选项。多个选项必须用空格分隔。
    • NUTCH_LOG_DIR:日志目录(default: $NUTCH_HOME/logs)
    • NUTCH_LOGFILE:日志文件(default: hadoop.log)
    • NUTCH_CONF_DIR:配置文件的路径(default: $NUTCH_HOME/conf)。多个路径必须用冒号“:”分隔。
    • JAVA_HOME
    • NUTCH_JAVA_HOME
    • NUTCH_HOME

如果您使用“ant”安装,那么您将获得一个新文件夹/nutch called /nutch/runtime/local,这是您必须实际运行 nutch 的位置。

提示:尝试阅读此页