小编Cha*_*Lin的帖子

"hadoop fs"shell命令和"hdfs dfs"shell命令之间有什么区别?

他们应该是平等的吗?

但是,为什么" hadoop fs"命令显示hdfs files" hdfs dfs"命令显示本地文件?

这是hadoop版本信息:

Hadoop 2.0.0-mr1-cdh4.2.1 Subversion git://ubuntu-slave07.jenkins.cloudera.com/var/lib/jenkins/workspace/CDH4.2.1-Packaging-MR1/build/cdh4/mr1/2.0.0 -mr1-cdh4.2.1/source -r由jenkins编写,于4月22日星期一10:48:26 PDT 2013

hadoop hdfs

100
推荐指数
5
解决办法
6万
查看次数

Python:让Python int像C int一样溢出

在Python中,当一个int大于2**31时,它会转为long:

a = 2147483647 a + 1 = 2147483648

b = -2147483648 b - 1 = -2147483649

但我需要像Python中的int那样的Python int溢出:

a = 2147483647 a + 1 = -2147483648

b = -2147483648 b - 1 = 2147483647

可能吗?提前致谢!

python int overflow

10
推荐指数
2
解决办法
4273
查看次数

有没有办法动态创建类(而不是实例)?

我有一个关于如何动态创建类(而不是实例)的问题.在我的项目中,我需要根据配置文件编写几个类似的类.例如,有一个像这样的JSON:

{                                                                                                                                                                              
    {                                                                                                                                                                          
        "lang": "python",                                                                                                                                                      
        "file": "class1.py",
        "args": ["arg1"]                                                                                                                                  
    },                                                                                                                                                                         
    {                                                                                                                                                                          
        "lang": "python",                                                                                                                                                      
        "file": "class2.py"  
        "args": ["arg2"]                                                                                                                                               
    }                                                                                                                                                                          
} 
Run Code Online (Sandbox Code Playgroud)

随后,我需要在下面编写两个java类:

1类:

public class Class1 extends ShellBolt implements IRichBolt {
    public Class1() {
        super("python", "class1.py");
    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields(arg1));
    }

    @Override
    public Map<String, Object> getComponentConfiguration() {
        return null;
    }
}
Run Code Online (Sandbox Code Playgroud)

等级2:

public class Class2 extends ShellBolt implements IRichBolt {

    public Class2() {
        super("python", "class2.py");
    }

    @Override
    public void declareOutputFields(OutputFieldsDeclarer declarer) {
        declarer.declare(new Fields(arg2));
    }

    @Override
    public …
Run Code Online (Sandbox Code Playgroud)

java

5
推荐指数
1
解决办法
242
查看次数

如何控制hadoop流输出文件的数量

这是详细信息:

输入文件位于hdfs路径中/user/rd/input,而hdfs输出路径是/user/rd/output 在输入路径中,有20,000个文件从part-00000到part-19999,每个文件大约是64MB.我想要做的是写一个hadoop流作业,将这20,000个文件合并到10,000个文件中.

有没有办法使用hadoop流媒体作业将这20,000个文件合并到10,000个文件?或者,换句话说,有没有办法控制hadoop流输出文件的数量?

提前致谢!

hadoop hadoop-streaming

3
推荐指数
1
解决办法
840
查看次数

标签 统计

hadoop ×2

hadoop-streaming ×1

hdfs ×1

int ×1

java ×1

overflow ×1

python ×1