小编Lit*_*les的帖子

读取驱动程序通过spark-submit发送的文件

我正在发送一个Spark作业,通过运行在远程集群上运行

spark-submit ... --deploy-mode cluster --files some.properties ...
Run Code Online (Sandbox Code Playgroud)

我想some.properties通过驱动程序代码读取文件的内容,即在创建Spark上下文和启动RDD任务之前.该文件将复制到远程驱动程序,但不会复制到驱动程序的工作目录.

我所知道的解决这个问题的方法是:

  1. 将文件上传到HDFS
  2. 将文件存储在app jar中

两者都不方便,因为在提交开发机器上经常更改此文件.

有没有办法--files在驱动程序代码main方法中读取使用该标志上载的文件?

apache-spark

33
推荐指数
4
解决办法
4万
查看次数

在Ruby中动态定义命名类

我正在用Ruby编写内部DSL.为此,我需要以编程方式创建命名类和嵌套类.这样做的最佳方法是什么?我认为有两种方法可以做到这一点:

  1. 使用Class.new创建一个匿名类,然后使用define_method的方法添加到它,最后调用const_set将其添加为命名常量一些命名空间.
  2. 使用某种方式 eval

我已经测试了第一种方式并且它有效,但是对Ruby来说是新手,我不确定将类作为常量是正确的方法.

还有其他更好的方法吗?如果没有,上述哪一项更可取?

ruby dsl metaprogramming metaclass

26
推荐指数
2
解决办法
1万
查看次数

用Java打开一个大文件非常慢

我有一个大的(12GB)文件,我需要使用Java从中提取小块数据(每个几千字节).一旦文件打开,寻找和读取数据的速度非常快,但打开文件本身需要长时间 - 大约90秒.有没有办法加快Java中的打开文件操作?

为了澄清,我尝试了以下选项来打开和读取文件:

new FileInputStream(file); 
new RandomAccessFile(file, "r");
Files.newByteChannel(path, StandardOpenOption.READ);
Run Code Online (Sandbox Code Playgroud)

其中每一个都产生了类似的结果.

java file-io nio large-files

13
推荐指数
1
解决办法
1235
查看次数

将jetty ResourceHandler映射到URL

是否可以使用嵌入式Jetty从目录X提供静态文件但映射到URL Y?我有静态文件存储在目录"web"下,但我希望URL类似于http://host/myapp.

我已经成功运行了ResourceHandler以下列方式配置的服务器:

ResourceHandler ctx = new ResourceHandler();
ctx.setResourceBase("path-to-web");
HandlerList list = new HandlerList();
list.addHandler(ctx);
...
server.setHandler(list);
Run Code Online (Sandbox Code Playgroud)

但结果是提供/web所需URL映射下的文件,而不是它们.

jetty embedded-jetty

9
推荐指数
1
解决办法
6707
查看次数

用于Java的GUI编辑器,可以在RUNTIME上操作对象

我正在寻找具有以下异域属性的Java GUI编辑器或库:可以在运行时操作GUI .也就是说,运行框架可以包括特殊控件,例如,右键单击,使用户能够向其添加按钮和其他小部件.

或者,我可以使用可以与正在运行的Java程序交互的GUI编辑器.该程序说"请添加一个按钮",编辑器会向用户显示带按钮的调色板.用户添加按钮并按下它,程序接收"按下按钮"事件.

有没有这样的东西可以现成使用,而无需从头开始编写?

java user-interface runtime gui-editor

8
推荐指数
1
解决办法
806
查看次数

如何在Graphviz中编写自定义箭头

我使用Graphviz(主要是dot和fdp)自动生成一些我需要的图表.对于这些图表,我需要一些不属于标准箭头集合的特殊箭头:一个大的白色三角形内部的小黑色三角形,以及指向下方的黑色三角形.

添加此类箭头的最佳方法是什么?如果有必要,我不介意破解源代码.我应该从哪里开始?

graphviz

6
推荐指数
1
解决办法
527
查看次数

在Erlang中使用无关变量匹配元组

我正在寻找一种在Erlang中使用部分元组在列表中查找元组的方法,类似于在Prolog中匹配的函子.例如,我想按照代码返回true:

member({pos, _, _}, [..., {pos, 1, 2}, ...])
Run Code Online (Sandbox Code Playgroud)

由于以下错误,此代码无法立即生效:

variable '_' is unbound
Run Code Online (Sandbox Code Playgroud)

有没有一种简单的方法来达到同样的效果?

erlang pattern-matching

6
推荐指数
1
解决办法
2973
查看次数

检查Erlang警卫的成员资格

在Erlang中编写if语句的最简单方法是什么,其中一部分守卫是member(E, L),即测试if是否E是列表的成员L?天真的方法是:

if 
  ... andalso member(E,L) -> ...
end
Run Code Online (Sandbox Code Playgroud)

但是,因为我理解正确,member不是一个守卫表达是行不通的.哪种方式有效?

erlang if-statement guard

6
推荐指数
2
解决办法
3216
查看次数

如何将Java bean属性设置为专家属性?

Java Beans Introspection API在PropertyDescriptor类中包含方法isExpert.基于Bean的GUI编辑器,如WindowsMaker,使用它来隐藏或显示"异国情调"属性.

是什么原因导致Java bean的某个属性被视为"专家"?例如,Swing库如何将某些属性设置为"专家属性"?我如何以编程方式为我编写的Java bean执行相同的操作?

java swing introspection javabeans

5
推荐指数
1
解决办法
612
查看次数

控制和监控YARN中同时映射/减少任务的数量

我在少数强大的机器上部署了Hadoop 2.2集群.我有一个约束使用YARN作为框架,我不是很熟悉.

  1. 如何控制实际地图的数量并减少并行运行的任务?每台机器都有许多CPU核心(12-32)和足够的RAM.我想最大限度地利用它们.
  2. 如何监控我的设置实际上是否能更好地利用机器?在哪里可以查看给定作业中使用了多少核心(线程,进程)?

在此先感谢帮助我融化这些机器:)

hadoop mapreduce hadoop-yarn

5
推荐指数
1
解决办法
5821
查看次数