小编pra*_*eep的帖子

如何在Java程序中使用Sqoop?

我知道如何通过命令行使用sqoop.但是不知道如何使用java程序调用sqoop命令.谁能给一些代码视图?

java hadoop sqoop

22
推荐指数
2
解决办法
3万
查看次数

如何在Hadoop-.20 api中指定KeyValueTextInputFormat分隔符?

在新的API(apache.hadoop.mapreduce.KeyValueTextInputFormat)中,如何指定除tab之外的分隔符(分隔符)(默认值)以分隔键和值.

样本输入:

one,first line
two,second line
Run Code Online (Sandbox Code Playgroud)

需要输出:

Key : one
Value : first line
Key : two
Value : second line
Run Code Online (Sandbox Code Playgroud)

我将KeyValueTextInputFormat指定为:

    Job job = new Job(conf, "Sample");

    job.setInputFormatClass(KeyValueTextInputFormat.class);
    KeyValueTextInputFormat.addInputPath(job, new Path("/home/input.txt"));
Run Code Online (Sandbox Code Playgroud)

这适用于tab作为分隔符.

java hadoop mapreduce

13
推荐指数
2
解决办法
2万
查看次数

使用maven和eclipse导出为Jar的构建项目之间的区别

这听起来像一个愚蠢的问题,但我真的很困惑.我从未使用过maven,但我知道它用于构建项目.

所以,我有一个问题:当我们可以在Eclipse中构建项目(没有Maven)时,为什么需要使用Maven构建项目.只需将eclipse项目导出为JAR并包含所需的库和所有项目.

假设,我从github下载任何项目.现在我可以在eclipse中导入该项目并将其导出为JAR并使用它的功能.那么为什么所有人都建议使用MAVEN来构建项目并生成二进制文件并使用它.

java eclipse github m2eclipse maven

7
推荐指数
3
解决办法
1万
查看次数

HDFS文件校验和

我试图使用Hadoop API - DFSCleint.getFileChecksum()复制到HDFS后检查文件的一致性.

我得到以上代码的以下输出:

Null
HDFS : null
Local : null
Run Code Online (Sandbox Code Playgroud)

谁能指出错误或错误?这是代码:

import java.io.IOException;

import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileChecksum;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.LocalFileSystem;
import org.apache.hadoop.fs.Path;


public class fileCheckSum {

    /**
     * @param args
     * @throws IOException 
     */
    public static void main(String[] args) throws IOException {
        // TODO Auto-generated method stub

        Configuration conf = new Configuration();

         FileSystem hadoopFS = FileSystem.get(conf);
    //  Path hdfsPath = new Path("/derby.log");

        LocalFileSystem localFS = LocalFileSystem.getLocal(conf);
    //      Path localPath = new Path("file:///home/ubuntu/derby.log");


    //  System.out.println("HDFS PATH : "+hdfsPath.getName()); …
Run Code Online (Sandbox Code Playgroud)

java hadoop checksum mapreduce hdfs

7
推荐指数
1
解决办法
1万
查看次数

Hadoop作业:任务无法报告状态601秒

在伪节点上运行hadoop作业时,任务失败并被杀死.错误:任务尝试_无法报告状态601秒

但是同一个程序正在运行Eclipse(本地工作).

任务:大约有25K关键字,输出将是所有可能的组合(一次两个),即大约25K*25K entires

可能是什么问题?

java eclipse hadoop mapreduce

5
推荐指数
1
解决办法
4770
查看次数

R-Cran和R-Forge项目之间的区别?

我是R的初学者

我发现有两个项目网站名为CRANR-Forge.

这两者究竟有什么区别?

r

5
推荐指数
2
解决办法
1764
查看次数

标签 统计

java ×5

hadoop ×4

mapreduce ×3

eclipse ×2

checksum ×1

github ×1

hdfs ×1

m2eclipse ×1

maven ×1

r ×1

sqoop ×1