小编dip*_*uru的帖子

如何加载java属性文件并在Spark中使用?

我想将Spark参数(如输入文件,输出文件)存储到Java属性文件中,并将该文件传递给Spark Driver.我使用spark-submit提交作业但找不到传递属性文件的参数.你有什么建议吗?

java properties-file apache-spark

21
推荐指数
2
解决办法
3万
查看次数

如何从spark设置和获取静态变量?

我有一个班级:

public class Test {
    private static String name;

    public static String getName() {
        return name;
    }

    public static void setName(String name) {
        Test.name = name;
    }

    public static void print() {
        System.out.println(name);
    }

}
Run Code Online (Sandbox Code Playgroud)

在我的Spark驱动程序中,我正在设置这样的名称并调用print()命令:

public final class TestDriver{

    public static void main(String[] args) throws Exception {
        SparkConf sparkConf = new SparkConf().setAppName("TestApp");
        // ...
        // ...
        Test.setName("TestName")
        Test.print();
        // ...
    }
}
Run Code Online (Sandbox Code Playgroud)

但是,我得到了一个NullPointerException.如何将值传递给全局变量并使用它?

java apache-spark spark-streaming

7
推荐指数
2
解决办法
1万
查看次数

如何获得火花工作的指标?

我们有一个拥有大约20个节点的集群.此群集在许多用户和作业之间共享.因此,我很难观察我的工作,以便获得一些指标,如CPU使用率,I/O,网络,内存等......

如何获得工作级别的指标.

PS:群集已经安装了Ganglia但不确定如何让它在作业级别上运行.我想要做的是监视集群使用的资源,仅执行我的工作.

performance hadoop ganglia apache-spark

7
推荐指数
1
解决办法
2552
查看次数

什么是可用于构建可扩展数据存储区的最佳工具包和技术?

我正计划开发一个能够应对可扩展性,灵活性和容错性的分布式数据存储.

我看过Erlang但发现了一些负面意见.

我可以使用AKKA构建数据存储区吗?

erlang scalability datastore bigdata

1
推荐指数
1
解决办法
116
查看次数