运行时的Kerberos模拟Spark上下文

mat*_*ieu 5 impersonation hadoop kerberos hadoop-yarn apache-spark

我有一个Spark应用程序，它通过多个线程上的几个Spark会话同时为不同的用户执行各种作业。

我的客户想对他的Hadoop集群进行kerberize。我想知道是否有一种方法可以配置模拟，例如将这些作业中的每一个与不同的代理用户一起运行。根据我在spark conf和代码中看到的内容，无法在运行时针对特定上下文执行此操作，但是我不熟悉Kerberos或Spark的这一部分。

任何人都可以确认/确认吗？

归档时间：	8 年，7 月前
查看次数：	193 次
最近记录：	8 年，7 月前

从eclipse启动mapreduce作业 8

PySpark:TypeError:'Column'对象不可调用 8

如何从任务中打印累加器变量(似乎"工作"而不调用值方法)？ 7

纱线上产生火花，容器退出，退出代码为非零143 7

Hadoop作业:任务无法报告状态601秒 5

为什么Spark在本地模式下失败并且"无法获得broadcast_0的broadcast_0_piece0"？ 5

S3A：在S3：在Spark EMR中工作时失败 4

使用Kerberos连接到Mapper内的Accumulo 4

Spark - 失败：Set() 解释 4

在spark中保存固定大小的镶木地板输出文件 4

如何通过引用传递变量？ 2480

INNER JOIN,LEFT JOIN,RIGHT JOIN和FULL JOIN之间有什么区别？ 1602

JavaScript中==和===之间的区别 1592

为什么将0.1f改为0会使性能降低10倍？ 1491

如何将堆栈跟踪转换为字符串？ 1435

UNION和UNION ALL有什么区别？ 1350

varchar和nvarchar有什么区别？ 1300

如何在SQL中使用JOIN执行UPDATE语句？ 1262

生成0到9之间的随机整数 1224

什么是(功能)反应式编程？ 1149