小编str*_*mer的帖子

您如何建议使用Hadoop流媒体进行"加入"?

我有两个文件,格式如下:

field1, field2, field3
field4, field1, field5
Run Code Online (Sandbox Code Playgroud)

不同的字段编号表示不同的含义.

我想使用基于相互字段的Hadoop Streaming加入这两个文件(field1在上面的示例中),因此输出将是field1, field2, field3, field4, field5(其他顺序可以正常,因为它们具有所有字段).

streaming hadoop join

11
推荐指数
1
解决办法
4112
查看次数

标签 统计

hadoop ×1

join ×1

streaming ×1