小编use*_*364的帖子

使用Java在hdfs中编写文件

我想在HDFS中创建一个文件并在其中写入数据.我用过这段代码:

Configuration config = new Configuration();     
FileSystem fs = FileSystem.get(config); 
Path filenamePath = new Path("input.txt");  
try {
    if (fs.exists(filenamePath)) {
        fs.delete(filenamePath, true);
    }

    FSDataOutputStream fin = fs.create(filenamePath);
    fin.writeUTF("hello");
    fin.close();
}

Run Code Online (Sandbox Code Playgroud)

它会创建文件,但不会在其中写入任何内容.我搜索了很多但没有找到任何东西.我的问题是什么？我是否需要获得HDFS写入权限？

谢谢.

java hadoop hdfs

use*_*364

2016 06-01

51
推荐指数

3
解决办法

9万
查看次数

我如何处理hadoop中的大量小文件？

我是hadoop的新手,我正在使用wordcount示例中的大量小文件.它需要大量的地图任务并导致我的执行速度变慢.

我怎样才能减少地图任务的数量？

如果我的问题的最佳解决方案是将小文件捕获到更大的文件,我该如何捕捉它们？

hadoop

use*_*364

2013 03-09

8
推荐指数

1
解决办法

4572
查看次数

如何在hadoop中实现排序？

我的问题是在文件中排序值.键和值是整数,需要维护排序值的键.

key   value
1     24
3     4
4     12
5     23

Run Code Online (Sandbox Code Playgroud)

输出:

Run Code Online (Sandbox Code Playgroud)

我正在处理大量数据,必须在hadoop机器集群中运行代码.我怎么能用mapreduce做到这一点？

sorting hadoop mapreduce

use*_*364

2014 01-26

8
推荐指数

1
解决办法

2万
查看次数

如何在hadoop mapreduce中进行lzo压缩？

我想使用lzo来压缩地图输出,但我无法运行它!我使用的Hadoop版本是0.20.2.我设置:

conf.set("mapred.compress.map.output", "true") 
conf.set("mapred.map.output.compression.codec",
"org.apache.hadoop.io.compress.LzoCodec");

Run Code Online (Sandbox Code Playgroud)

当我在Hadoop中运行jar文件时,它显示一个无法写入地图输出的异常.

我必须安装lzo吗？使用lzo我该怎么办？

hadoop mapreduce

use*_*364

2015 07-22

1
推荐指数

1
解决办法

8202
查看次数

标签统计

hadoop ×4

mapreduce ×2

hdfs ×1

java ×1

sorting ×1

使用Java在hdfs中编写文件

我如何处理hadoop中的大量小文件？

如何在hadoop中实现排序？

如何在hadoop mapreduce中进行lzo压缩？

标签 统计

小编use_364的帖子

标签统计