小编Mri*_*lla的帖子

使用 Spark 和 IntelliJ 时出现 NoSuchMethodError

我是 Scala 和 Spark 的新手。我对使用 IntelliJ 进行工作如此困难感到沮丧。目前,我无法运行下面的代码。我确信这很简单,但我无法让它发挥作用。

我正在尝试运行:

import org.apache.spark.{SparkConf, SparkContext}

object TestScala {
  def main(args: Array[String]): Unit = {
    val conf = new SparkConf()
    conf.setAppName("Datasets Test")
    conf.setMaster("local[2]")
    val sc = new SparkContext(conf)
    println(sc)
  }
}
Run Code Online (Sandbox Code Playgroud)

我得到的错误是:

Exception in thread "main" java.lang.NoSuchMethodError: scala.Predef$.refArrayOps([Ljava/lang/Object;)Lscala/collection/mutable/ArrayOps;
at org.apache.spark.util.Utils$.getCallSite(Utils.scala:1413)
at org.apache.spark.SparkContext.<init>(SparkContext.scala:77)
at TestScala$.main(TestScala.scala:13)
at TestScala.main(TestScala.scala)
at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
at java.lang.reflect.Method.invoke(Method.java:498)
at com.intellij.rt.execution.application.AppMain.main(AppMain.java:147)
Run Code Online (Sandbox Code Playgroud)

我的 build.sbt 文件:

name := "sparkBook"

version := "1.0"

scalaVersion := "2.12.1"
Run Code Online (Sandbox Code Playgroud)

jvm scala intellij-idea apache-spark

4
推荐指数
1
解决办法
1万
查看次数

cx_Freeze和PYC/PYD文件

我正在使用cx_Freeze来冻结我的python程序.在运行cx_Freeze时,会创建一堆PYD文件,将一大堆PYC文件放入名为library.zip的存档中,并且还有一些DLL文件.

有人能告诉我PYC和PYD文件之间的区别吗?PYD文件不在library.zip中的原因是什么?是否可以将PYD文件放入存档中?

谢谢.

python cx-freeze

3
推荐指数
1
解决办法
3228
查看次数

从图像列表中查找最大的图像尺寸

我有一个本地保存的图像列表(路径).如何从这些中找到最大的图像?我不是指文件大小而是指尺寸.

所有图像都是常见的网络兼容格式 - JPG,GIF,PNG等.

谢谢.

python

3
推荐指数
2
解决办法
1481
查看次数

在 Java 中同时发出 Web 请求

有人可以指出我进行并行网络请求的片段吗?我需要发出 6 个 Web 请求并连接 HTML 结果。

有没有一种快速的方法来完成这个,还是我必须走线程的方式?

谢谢你。

java concurrency multithreading

3
推荐指数
1
解决办法
3738
查看次数

如何将具有完整月份名称的String日期转换为java中的Date对象?

如何将具有完整月份名称的日期转换为Java中的Date对象?这是我需要转换的样本日期:2002年12月6日.

谢谢.

java

3
推荐指数
1
解决办法
1万
查看次数

使用 Ruby 获取 URL(带参数)

有人能告诉我如何使用 Ruby 获取(GET)一个 URL(带参数)吗?我在网上找到了一堆例子,但我找不到一个解释我也可以传递参数的例子。

ruby

3
推荐指数
1
解决办法
6916
查看次数

使用Nokogiri解析表

我想用Nokogiri解析一张桌子.我是这样做的

def parse_table_nokogiri(html)

    doc = Nokogiri::HTML(html)

    doc.search('table > tr').each do |row|
        row.search('td/font/text()').each do |col|
            p col.to_s
        end
    end

end
Run Code Online (Sandbox Code Playgroud)

我有一些表有这样的行:

<tr>
  <td>
     Some text
  </td>
</tr>
Run Code Online (Sandbox Code Playgroud)

......有些人有这个.

<tr>
  <td>
     <font> Some text </font>
  </td>
</tr>
Run Code Online (Sandbox Code Playgroud)

我的XPath表达式适用于第二种情况,但不适用于第一种情况.是否有一个我可以使用的XPath表达式,它将从单元格的最内层节点给我文本,以便我可以处理这两种情况?


我已将更改合并到我的代码段中

def parse_table_nokogiri(html)

    doc = Nokogiri::HTML(html)
    table = doc.xpath('//table').max_by {|table| table.xpath('.//tr').length}

    rows = table.search('tr')[1..-1]
    rows.each do |row|

        cells = row.search('td//text()').collect {|text| CGI.unescapeHTML(text.to_s.strip)}
        cells.each do |col|

            puts col
            puts "_____________"

        end

    end

end
Run Code Online (Sandbox Code Playgroud)

ruby xpath nokogiri

3
推荐指数
1
解决办法
6387
查看次数

在处理包/蛋时,zc.buildout是否提供了比pip更多的东西

我们都是开发团队在Django网站上工作.最近我们开始zc.buildout在里面使用了virtualenv.我可以看到如何virtualenv通过沙盒环境来帮助您.创建沙箱后,可以简单地使用pip安装必要的包/鸡蛋.我读过pip可以加载需求文件中的所有鸡蛋.这让我质疑它的好处和附加功能zc.buildout.zc.buildout下载你在buildout.cfg文件中提到的鸡蛋,但正如我所写,你已经可以使用pip和需求文件.是否zc.buildout做更多的事情我失踪?我已经可以使用我的所有自动化Fabric.

python django egg pip buildout

3
推荐指数
1
解决办法
336
查看次数

使用HTMLParser从页面中提取绝对链接

我正在使用以下代码段来提取页面上的所有链接HTMLParser.我得到了不少相对网址.如何将这些转换为域的绝对URL,例如www.exmaple.com

import htmllib, formatter
import urllib, htmllib, formatter

class LinksExtractor(htmllib.HTMLParser):

   def __init__(self, formatter):
      htmllib.HTMLParser.__init__(self, formatter)
      self.links = []

   def start_a(self, attrs):
      if len(attrs) > 0 :
         for attr in attrs :
            if attr[0] == "href":
                self.links.append(attr[1])

   def get_links(self):
      return self.links


format = formatter.NullFormatter()
htmlparser = LinksExtractor(format)

data = urllib.urlopen("http://cis.poly.edu/index.htm")
htmlparser.feed(data.read())
htmlparser.close()

links = htmlparser.get_links()
print links
Run Code Online (Sandbox Code Playgroud)

谢谢

html python html-parsing

3
推荐指数
1
解决办法
2854
查看次数

本地Git存储库的Git Archive

我在服务器上有一个Git存储库,在同一台服务器上我有一个需要执行git archive存储库的脚本.

这是我的示例git archive命令,适用于远程Git存储库:

sudo git archive --remote=ssh://uname@dev.example.com/var/repo/myrepo.git --format=tar --output=src.tar development
Run Code Online (Sandbox Code Playgroud)

我需要做什么/更改以在同一服务器上执行上述命令,以便我不需要放置所有SSH的东西?由于该命令与存储库在同一台机器上运行,因此我可以直接访问Git目录.

谢谢

unix linux git

3
推荐指数
1
解决办法
4882
查看次数