小编pra*_*eep的帖子

如何在Java程序中使用Sqoop？

我知道如何通过命令行使用sqoop.但是不知道如何使用java程序调用sqoop命令.谁能给一些代码视图？

java hadoop sqoop

pra*_*eep

lucky-day

22
推荐指数

2
解决办法

3万
查看次数

如何在Hadoop-.20 api中指定KeyValueTextInputFormat分隔符？

在新的API(apache.hadoop.mapreduce.KeyValueTextInputFormat)中,如何指定除tab之外的分隔符(分隔符)(默认值)以分隔键和值.

样本输入:

one,first line
two,second line

Run Code Online (Sandbox Code Playgroud)

需要输出:

Key : one
Value : first line
Key : two
Value : second line

Run Code Online (Sandbox Code Playgroud)

我将KeyValueTextInputFormat指定为:

    Job job = new Job(conf, "Sample");

    job.setInputFormatClass(KeyValueTextInputFormat.class);
    KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));

Run Code Online (Sandbox Code Playgroud)

这适用于tab作为分隔符.

java hadoop mapreduce

pra*_*eep

2012 02-10

13
推荐指数

2
解决办法

2万
查看次数

使用maven和eclipse导出为Jar的构建项目之间的区别

这听起来像一个愚蠢的问题,但我真的很困惑.我从未使用过maven,但我知道它用于构建项目.

所以,我有一个问题:当我们可以在Eclipse中构建项目(没有Maven)时,为什么需要使用Maven构建项目.只需将eclipse项目导出为JAR并包含所需的库和所有项目.

假设,我从github下载任何项目.现在我可以在eclipse中导入该项目并将其导出为JAR并使用它的功能.那么为什么所有人都建议使用MAVEN来构建项目并生成二进制文件并使用它.

java eclipse github m2eclipse maven

pra*_*eep

2016 03-09

7
推荐指数

3
解决办法

1万
查看次数

HDFS文件校验和

我试图使用Hadoop API - DFSCleint.getFileChecksum()复制到HDFS后检查文件的一致性.

我得到以上代码的以下输出:

Null
HDFS : null
Local : null

Run Code Online (Sandbox Code Playgroud)

谁能指出错误或错误？这是代码:

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileChecksum;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.LocalFileSystem;
import org.apache.hadoop.fs.Path;


public class fileCheckSum {

    /**
     * @param args
     * @throws IOException 
     */
    public static void main(String[] args) throws IOException {
        // TODO Auto-generated method stub

        Configuration conf = new Configuration();

         FileSystem hadoopFS = FileSystem.get(conf);
    //  Path hdfsPath = new Path("/derby.log");

        LocalFileSystem localFS = LocalFileSystem.getLocal(conf);
    //      Path localPath = new Path("file:///home/ubuntu/derby.log");


    //  System.out.println("HDFS PATH : "+hdfsPath.getName()); …

Run Code Online (Sandbox Code Playgroud)

java hadoop checksum mapreduce hdfs

pra*_*eep

2013 01-29

7
推荐指数

1
解决办法

1万
查看次数