小编Mat*_*rio的帖子

Spark java.lang.OutOfMemoryError:Java堆空间

我的集群:1个主服务器,11个从服务器,每个节点有6 GB内存.

我的设置:

spark.executor.memory=4g, Dspark.akka.frameSize=512

Run Code Online (Sandbox Code Playgroud)

这是问题所在:

首先,我从HDFS到RDD读取了一些数据(2.19 GB):

val imageBundleRDD = sc.newAPIHadoopFile(...)

Run Code Online (Sandbox Code Playgroud)

其次,在这个RDD上做点什么:

val res = imageBundleRDD.map(data => {
                               val desPoints = threeDReconstruction(data._2, bg)
                                 (data._1, desPoints)
                             })

Run Code Online (Sandbox Code Playgroud)

最后,输出到HDFS:

res.saveAsNewAPIHadoopFile(...)

Run Code Online (Sandbox Code Playgroud)

当我运行我的程序时,它显示:

.....
14/01/15 21:42:27 INFO cluster.ClusterTaskSetManager: Starting task 1.0:24 as TID 33 on executor 9: Salve7.Hadoop (NODE_LOCAL)
14/01/15 21:42:27 INFO cluster.ClusterTaskSetManager: Serialized task 1.0:24 as 30618515 bytes in 210 ms
14/01/15 21:42:27 INFO cluster.ClusterTaskSetManager: Starting task 1.0:36 as TID 34 on executor 2: Salve11.Hadoop (NODE_LOCAL)
14/01/15 21:42:28 INFO …

Run Code Online (Sandbox Code Playgroud)

out-of-memory apache-spark

heq*_*128

2015 11-25

208
推荐指数

9
解决办法

21万
查看次数

如何从Scala中的资源文件夹中读取文件？

我有一个像下面的文件夹结构:

- main
-- java
-- resources 
-- scalaresources
--- commandFiles

Run Code Online (Sandbox Code Playgroud)

在那个文件夹中,我有我必须阅读的文件.这是代码:

def readData(runtype: String, snmphost: String, comstring: String, specificType:  String): Unit = {
  val realOrInvFile = "/commandFiles/snmpcmds." +runtype.trim // these files are under commandFiles folder, which I have to read. 
    try {
      if (specificType.equalsIgnoreCase("Cisco")) {
        val specificDeviceFile: String = "/commandFiles/snmpcmds."+runtype.trim+ ".cisco"
        val realOrInvCmdsList = scala.io.Source.fromFile(realOrInvFile).getLines().toList.filterNot(line => line.startsWith("#")).map{
          //some code 
        }
        val specificCmdsList = scala.io.Source.fromFile(specificDeviceFile).getLines().toList.filterNot(line => line.startsWith("#")).map{
          //some code
        }
      }
    } catch {
      case e: Exception => e.printStackTrace
    } …

Run Code Online (Sandbox Code Playgroud)

scala scala-collections

Pra*_*rad

2015 12-04

97
推荐指数

4
解决办法

10万
查看次数

如何在SBT Scala项目中使用MySQL JDBC驱动程序？

当我在SBT会话期间第一次运行我的项目时,它在尝试访问MySQL数据库时抛出以下异常:

java.lang.NoClassDefFoundError:scala/Ordered

当我再次运行它(以及之后的任何时间,在同一个SBT会话期间),它会抛出另一个:

java.sql.SQLException:没有为jdbc找到合适的驱动程序:mysql:// localhost/...

当我使用NetBeans时,相同的代码工作正常.现在,当我使用SBT构建和Kate手动编辑和管理我的项目时,我得到了这些运行时错误.

MySQL JDBC驱动程序(从MySQL.com下载)JAR位于项目的lib目录中,我放在那里的所有其他库都可以正常工作.

这是代码:

import java.sql._
...
// read
val dbc : Connection = DriverManager.getConnection("jdbc:mysql://localhost/...")
val st : Statement = dbc.createStatement
val rs : ResultSet = st.executeQuery("SELECT ...")
if(rs.first) result = rs.getDouble("field")
dbc.close
...
// write
val dbc : Connection = DriverManager.getConnection("jdbc:mysql://localhost/...")
val st : Statement = dbc.createStatement
st.execute("UPDATE ...")
dbc.close

Run Code Online (Sandbox Code Playgroud)

我看过一个看起来非常相关的问题,但仍然没有答案.

mysql scala jdbc sbt

Iva*_*van

2016 06-07

32
推荐指数

2
解决办法

2万
查看次数

生成项目时,如何有条件地在原型中包含或排除文件？

我正在为我们的项目(Weld)创建Maven 2原型.我希望能够根据在其中定义的属性的值来控制将哪些文件放入生成的项目中archetype:generate.例如,我预见到以下提示:

Define value for groupId: : com.example
Define value for artifactId: : myproject
Define value for package:  com.example: :
Define value for includeGradleSupport: : y

Run Code Online (Sandbox Code Playgroud)

根据includeGradleSupport的值,我想build.gradle在生成的项目中包含(或不包括)该文件.如果用户不想要Gradle支持,我不希望用不必要的文件混乱生成的项目.

另一个例子是,如果用户想要Jetty支持,我可能需要提供一个Jetty Web片段(也许是为了激活一个监听器).

这完全取决于开发人员打算使用的项目定制.虽然我可以创建一个完整的其他原型,但有时候这些更改很轻微,以至于包含/排除文件会更容易.

有没有办法使用archetype-metadata.xml描述符控制此行为？

java maven-2 archetypes gradle

Dan*_*len

2016 03-31

22
推荐指数

1
解决办法

3869
查看次数

如何从镶木地板文件中获取架构/列名称？

我有一个存储在HDFS中的文件 part-m-00000.gz.parquet

我试图运行,hdfs dfs -text dir/part-m-00000.gz.parquet但它已经压缩,所以我运行gunzip part-m-00000.gz.parquet但它没有解压缩文件,因为它无法识别.parquet扩展名.

如何获取此文件的架构/列名称？

hadoop apache-pig hdfs parquet

Sup*_*ohn

2015 12-03

22
推荐指数

4
解决办法

4万
查看次数

如何在scala中读取属性文件

我是Scala编程的新手,我想在Scala中读取属性文件.

我找不到任何API来读取Scala中的属性文件.

如果有任何API用于读取Scala中的属性文件,请告知我们.

scala

sun*_*nil

2015 12-02

19
推荐指数

3
解决办法

2万
查看次数

递归值xxx需要在Scala中输入

我很困惑为什么Scala抱怨这段代码.我有两个相互依赖的课程.当我尝试创建A没有类型声明的新实例时,代码将无法编译.

  class A( b:B ) {

  }

  class B( a:A ){

  }

  val y = new A ( new B( y ) ); // gives recursive value y needs type

  val z:A = new A ( new B( y ) ); // ok

Run Code Online (Sandbox Code Playgroud)

为什么编译器不知道y我声明的类型new A ？

scala type-inference

Jay*_*Jay

2016 06-07

17
推荐指数

1
解决办法

2万
查看次数

将AngularJS变量绑定到CSS语法中

我试图弄清楚如何将AngularJS范围变量绑定到CSS语法中.我认为问题在于大括号.这是我基本上要做的事情:

<style>.css_class {background:{{ angular_variable }}; color:#ffffff;}</style>
<style>.css_rule {background:{{ "#000000" }}; color:#ffffff;}</style>
<style>.css_rule {background:{{ var | someFilter }}; color:#ffffff;}</style>

Run Code Online (Sandbox Code Playgroud)

关于如何实现这一点的任何想法？谢谢!

css angularjs

dco*_*enb

2016 01-11

16
推荐指数

1
解决办法

2万
查看次数