小编Cha*_*Lin的帖子

"hadoop fs"shell命令和"hdfs dfs"shell命令之间有什么区别？

他们应该是平等的吗？

但是,为什么" hadoop fs"命令显示hdfs files" hdfs dfs"命令显示本地文件？

这是hadoop版本信息:

Hadoop 2.0.0-mr1-cdh4.2.1 Subversion git://ubuntu-slave07.jenkins.cloudera.com/var/lib/jenkins/workspace/CDH4.2.1-Packaging-MR1/build/cdh4/mr1/2.0.0 -mr1-cdh4.2.1/source -r由jenkins编写,于4月22日星期一10:48:26 PDT 2013

hadoop hdfs

Cha*_*Lin

2014 08-12

100
推荐指数

5
解决办法

6万
查看次数

Python:让Python int像C int一样溢出

在Python中,当一个int大于2**31时,它会转为long:

a = 2147483647 a + 1 = 2147483648

b = -2147483648 b - 1 = -2147483649

但我需要像Python中的int那样的Python int溢出:

a = 2147483647 a + 1 = -2147483648

b = -2147483648 b - 1 = 2147483647

可能吗？提前致谢!

python int overflow

Cha*_*Lin

2013 09-13

10
推荐指数

2
解决办法

4273
查看次数

有没有办法动态创建类(而不是实例)？

我有一个关于如何动态创建类(而不是实例)的问题.在我的项目中,我需要根据配置文件编写几个类似的类.例如,有一个像这样的JSON:

{                                                                                                                                                                              
    {                                                                                                                                                                          
        "lang": "python",                                                                                                                                                      
        "file": "class1.py",
        "args": ["arg1"]                                                                                                                                  
    },                                                                                                                                                                         
    {                                                                                                                                                                          
        "lang": "python",                                                                                                                                                      
        "file": "class2.py"  
        "args": ["arg2"]                                                                                                                                               
    }                                                                                                                                                                          
}

Run Code Online (Sandbox Code Playgroud)

随后,我需要在下面编写两个java类:

1类:

public class Class1 extends ShellBolt implements IRichBolt {
    public Class1() {
        super("python", "class1.py");
    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields(arg1));
    }

    @Override
    public Map<String, Object> getComponentConfiguration() {
        return null;
    }
}

Run Code Online (Sandbox Code Playgroud)

等级2:

public class Class2 extends ShellBolt implements IRichBolt {

    public Class2() {
        super("python", "class2.py");
    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields(arg2));
    }

    @Override
    public …

Run Code Online (Sandbox Code Playgroud)

java

Cha*_*Lin

lucky-day

5
推荐指数

1
解决办法

242
查看次数

如何控制hadoop流输出文件的数量

这是详细信息:

输入文件位于hdfs路径中/user/rd/input,而hdfs输出路径是/user/rd/output 在输入路径中,有20,000个文件从part-00000到part-19999,每个文件大约是64MB.我想要做的是写一个hadoop流作业,将这20,000个文件合并到10,000个文件中.

有没有办法使用hadoop流媒体作业将这20,000个文件合并到10,000个文件？或者,换句话说,有没有办法控制hadoop流输出文件的数量？

提前致谢!

hadoop hadoop-streaming

Cha*_*Lin

2013 10-11

3
推荐指数

1
解决办法

840
查看次数