在Dataproc中进行Hive授权

ris*_*097 2 google-cloud-dataproc

Dataproc尚未与Apache Ranger和Apache Sentry集成在一起。那么在Hive中推荐的用户授权方式是什么?

我是Dataproc的新手,您的回答确实会有所帮助。

Jam*_*mes 5

这是一个很好的问题。

在某些背景下,Cloud Dataproc(和其他Cloud服务)的总体目标是使安全性/ IAM适用于各个产品。在许多情况下,使用大量Hive的客户最终会切换到具有特定控件的BigQuery。

在群集级别,群集将在服务帐户下运行,并且您可以切换群集使用的服务帐户。这意味着您可以将群集访问权限限制为该服务帐户有权访问的内容(例如GCS存储桶等)。这会将特定群集的作用域限定为仅访问一组特定资源。

在用户级别,您可以通过Dataproc IAM角色来控制对Dataproc的访问。但是,正如您所注意到的,当某人可以访问群集时,他们可以有效地利用群集可以访问的任何内容。

我们通常会看到客户创建一组项目和服务帐户以划分其安全需求。例如,客户可以创建三个项目,一个用于销售,一个用于营销,以及一个用于开发人员。所有这些帐户都设置了各种权限,因此,它们对Cloud Dataproc的使用具有固有的范围。

话虽如此,这已成为长期改进的重点领域。

(免责声明-是Cloud Dataproc PM)