我想尝试在YARN中设置内存,所以我将尝试在yarn-site.xml和mapred-site.xml上配置一些参数.顺便说一句,我使用hadoop 2.6.0.但是,当我做mapreduce工作时,我收到一个错误.它像这样说:
15/03/12 10:57:23 INFO mapreduce.Job: Task Id :
attempt_1426132548565_0001_m_000002_0, Status : FAILED
Error: Java heap space
Container killed by the ApplicationMaster.
Container killed on request. Exit code is 143
Container exited with a non-zero exit code 143
Run Code Online (Sandbox Code Playgroud)
我认为我已经正确配置了,我给map.java.opts和reduce.java.opts小尺寸= 64 MB.我尝试配置一些参数,比如在mapred-site.xml上更改map.java.opts和reduce.java.opts,我仍然会收到此错误.我认为我并不真正理解YARN记忆是如何工作的.顺便说一下,我试试单节点计算机.
如何"从文件中删除新行?
例如:
"one",
"three
four",
"seven"
Run Code Online (Sandbox Code Playgroud)
所以,我想删除\n之间three和four.我应该使用正则表达式,还是我必须使用程序读取每个字符的文件?
我在Java中有一个简单的弹性搜索代码,如下所示:
public class TryElastic {
public static void main(String[] args) throws UnknownHostException {
Map<String, Object> json = new HashMap<String, Object>();
json.put("user","kimchy");
json.put("postDate",new Date());
json.put("message","trying out Elasticsearch");
try {
Settings settings = Settings.settingsBuilder()
.put("cluster.name", "elasticsearch")
.put("client.transport.sniff", true).build();
TransportClient client = TransportClient.builder().settings(settings).build();
//client.addTransportAddress(new InetSocketTransportAddress(InetAddress.getByName("localhost"), 9300));
} catch (NoNodeAvailableException e) {
System.out.println(e.toString());
}
System.out.println("test");
}
Run Code Online (Sandbox Code Playgroud)
}
这很简单,但我在以下行中出错:
TransportClient client = TransportClient.builder().settings(settings).build();
Run Code Online (Sandbox Code Playgroud)
它显示如下错误消息:
Exception in thread "main" java.lang.NullPointerException
at java.io.Reader.<init>(Reader.java:78)
at java.io.InputStreamReader.<init>(InputStreamReader.java:113)
at org.elasticsearch.node.internal.InternalSettingsPreparer.randomNodeName(InternalSettingsPreparer.java:198)
at org.elasticsearch.node.internal.InternalSettingsPreparer.finalizeSettings(InternalSettingsPreparer.java:177)
at org.elasticsearch.node.internal.InternalSettingsPreparer.prepareSettings(InternalSettingsPreparer.java:64)
at org.elasticsearch.client.transport.TransportClient$Builder.build(TransportClient.java:119)
at TryElastic.main(TryElastic.java:64)
Run Code Online (Sandbox Code Playgroud)
所以,你能给我一些建议吗,我一直在寻找解决方案,但我找不到.有没有我要实现的配置?我的elasticsearch服务器已正确运行,它可以执行索引并从命令提示符获取查询.谢谢...
我想问一下,如果我使用詹金斯.如何获取所有工件列表并下载它,但不能从jenkins Web界面获取.我想为某些目标制作自己的网络界面.
有没有jenkins API可以做到这一点?
例如,如果我有 1 GB 的 csv 文件,并且我想将其快速导入到 mysql,我该怎么办?我之前尝试过导入 1 GB 文件,大约需要 1.5 小时。我使用 RAM 为 16 GB 的计算机。如果我想上传较大的文件,则需要更长的时间。
那么,我应该怎样做才能加快这个过程呢?谢谢....
我想问一下,在运行我的hadoop mapreduce应用程序后,如何获得该应用程序的总内存和CPU使用率.我在日志和资源管理器网页上看过它,但我没有得到它.
可能吗?我可以在每个作业执行或每个应用程序中获取它,并且我是否可以按节点使用情况或总使用量获取它?
非常感谢....
我想问一下.首先,我将告诉我在windows dekstop上开发应用程序使用codeIgniter.它清晰而完整.
但是,在我将该项目移至debian服务器之后,它说:
The requested URL /index.php/Admin was not found on this server.
Run Code Online (Sandbox Code Playgroud)
我想问一下,为什么我得到这样的输出?虽然我使用相同的代码运行相同的项目.我该怎么做才能解决这个问题?
谢谢...
YARN是Hadoop第二代,不再使用jobtracker守护进程,而是用资源管理器代替。但是为什么在mapred-site.xml hadoop 2上有一个mapreduce.jobtracker.address属性呢?
hadoop ×3
hadoop-yarn ×3
mapreduce ×3
java ×2
api ×1
artifact ×1
bash ×1
codeigniter ×1
cpu-usage ×1
csv ×1
debian ×1
download ×1
exception ×1
file ×1
heap ×1
import ×1
java-api ×1
jenkins ×1
jenkins-api ×1
jobs ×1
linux ×1
memory ×1
mysql ×1
newline ×1
performance ×1
php ×1
regex ×1
row ×1
ubuntu ×1
url ×1
xml ×1