小编Mar*_*ria的帖子

Spark.cores.max 是如何工作的?

我对spark.cores.max定义感到困惑

我网上有的是

spark.cores.max represents the total number of CPU cores for the whole application
Run Code Online (Sandbox Code Playgroud)

我的集群有 8 个工作节点和 1 个主节点。每个节点都有 4 个核心和 100 GB 内存。

它是指每个工作节点的核心总数还是所有 8 个工作节点的核心总数?

如果我将spark.cores.max设置为12并且cores/executor设置为4,这意味着什么?

apache-spark

4
推荐指数
1
解决办法
4908
查看次数

LDAP 中的域名和 DC

我正在尝试使用 SSL 连接支持 LDAP 的 Active Directory。

但对一些术语感到困惑。帮助我以非常简单的方式理解。

请纠正我

  1. Domain Name or Host Name or DNS:这是运行 Active Directory 服务的服务器地址或名称。

  2. DC or Domain Component or Domain Controller:这是 Active Directory 中的文件夹名称。例如,如果我给出DC=gp,DC=gl,DC=google,DC=com",则gp是 文件夹内部googlegoogle是 文件夹内部com

  3. CN=Dev-India,OU=Distribution Groups:CN是属于 的用户名OU group。该用户将在文件夹结构中查找某些内容 DC=gp,DC=gl,DC=google,DC=com"

  4. 主机名可以类似于顶级 DC(文件夹)名称吗?

  5. LDAP 中的 DC 和 AD 域名和主机名有什么区别?

ldap active-directory ldap-query

3
推荐指数
1
解决办法
1万
查看次数

数组中的相等元素

今天面试了,被问到一个问题,我都听不懂。

问题:

给定一个array 由整数组成的。

获取至少在相等的元素array

在计算时,您可以进行以下两种操作

  • 取数组的最小元素之一并将其值加一(更正式地说,如果 的最小值为 ,则选择这样的索引 = 并设置 :=+1);

  • 取数组的最大元素之一并将其值减一(更正式地说,如果 的最大值为 ,则选择这样的索引 = 并设置 :=?1)。

计算获得数组中至少相等元素所需的最小移动次数。

任何人都可以帮助我理解,实际问题是什么,以便我可以编写代码?

java arrays algorithm mathematical-optimization

2
推荐指数
1
解决办法
375
查看次数

Spark中如何使用foreachPartition?

如何在 Spark Java 中使用以下函数?查遍了互联网但找不到合适的例子。

public void foreachPartition(scala.Function1<scala.collection.Iterator<T>,scala.runtime.BoxedUnit> f)
Run Code Online (Sandbox Code Playgroud)

我唯一知道的是它对流程有好处batch of data,所谓的BoxedUnit

如何获取或batch ID批量处理数据?BoxedUnitdataset

谁能告诉我如何实现这个方法?

java apache-spark spark-structured-streaming

1
推荐指数
1
解决办法
5524
查看次数