小编54l*_*l3d的帖子

使用Hive表的Hive UDF

我已经在java中开发了一个正常工作的hive udf,我的函数返回输入和hive表中的列之间的最佳匹配,所以它有这个简化的伪代码:

class myudf  extends udf{

    evaluate(Text input){

        getNewHiveConnection(); //i want to replace this by getCurrentHiveUserConnetion();
        executeHiveQuery(input);
        return something;
}
Run Code Online (Sandbox Code Playgroud)

我的问题是,如果这个函数是由Hive调用的,为什么我需要在我的代码中连接到hive?我可以使用当前连接使用我的功能的用户连接吗?

java hive user-defined-functions udf

9
推荐指数
1
解决办法
1531
查看次数

使用avro-tools的Concat Avro文件

我试图将avro文件合并到一个大文件中,问题是concat命令不接受通配符

hadoop jar avro-tools.jar concat /input/part* /output/bigfile.avro
Run Code Online (Sandbox Code Playgroud)

我明白了:

线程"main"中的异常java.io.FileNotFoundException:文件不存在:/ input/part*

我试图使用"",''但没有机会.

hadoop hdfs avro avro-tools

8
推荐指数
1
解决办法
6699
查看次数

Talend:更新subjob中的全局变量

我简化的工作看起来像这样:

tSetGlobalVar --->(onSubJobOK)---> tRunJob --->(onSubJobOK)---> tJava

  • tSetGlobalVar将定义一个全局变量,其初始值可以说: myKey:"firstValue"
  • tRunJob将运行一个子作业,该子作业只包含第二个tSetGlobalVar组件,该组件应该为主作业中定义的全局变量设置一个新值: ((String)globalMap.get("myKey")): "newValue" 也试过这个: "myKey": "newValue"
  • tJava只用于调试,它的代码如下: System.out.println(((String)globalMap.get("myKey")));

实际产量: firstValue

预期产量: newValue

有没有其他方法可以修改子工作中的全局变量的值并获取主作业中的更新值?

talend

5
推荐指数
2
解决办法
2万
查看次数

Spark配置优先级

在代码中指定spark应用程序配置之间是否存在任何差异或优先级:

SparkConf().setMaster(yarn)
Run Code Online (Sandbox Code Playgroud)

并在命令行中指定它们

spark-submit --master yarn
Run Code Online (Sandbox Code Playgroud)

hadoop-yarn apache-spark

5
推荐指数
2
解决办法
1814
查看次数

Hadoop HDFS:垃圾箱位置

何时何地HDFS创建.Trash文件夹?

是否有任何规则或逻辑,任何参考?

hadoop hdfs hadoop2

4
推荐指数
2
解决办法
1万
查看次数

甲骨文看好

Oracle Doc中没有表达式背后的例子,因此我尝试使用Java语法,这应该在查询后得到任何数字TOP

select regexp_substr('TIPTOP4152','(?<=TOP)\d+') sub from dual
Run Code Online (Sandbox Code Playgroud)

但是什么也没显示!

regex sql oracle

2
推荐指数
1
解决办法
1905
查看次数

如何通过 REST API 将用户添加到 Apache Ranger

如标题所示,如何通过 REST API 手动将用户添加到 Apache Ranger。

你能发布一个curl调用的例子吗?

你能在成瘾中发布一个网址,我可以在其中找到以下文档:

   http:<ip>:6080/service/xusers/???
Run Code Online (Sandbox Code Playgroud)

apache policy hadoop apache-ranger

1
推荐指数
1
解决办法
6413
查看次数