小编Ale*_*uma的帖子

在源 kafka 集群上禁用mirrormaker2偏移同步主题

我们使用MirrorMaker2将一些主题从一个 Kerberized kafka 集群复制到另一个 kafka 集群(严格单向)。我们不控制源 kafka 集群,我们只能访问描述和读取要使用的特定主题。

MirrorMaker2 在源集群中创建并维护一个主题 ( mm2-offset-syncs),以对要复制的每个主题分区的集群到集群偏移映射进行编码,并且还在AdminClient源集群中创建一个主题来处理 ACL/Config 传播。因为 MM2 需要授权才能在源集群中创建和写入这些主题,或者通过 执行操作AdminClient,所以我试图了解为什么/是否需要在我们的场景中使用这些机制。

我的问题是:

  1. 在严格单向的场景中,这个源集群偏移同步主题对 Mirrormaker 有什么用处?
  2. 如果确实是多余的,是否可以禁用它或操作 mm2 而无需访问创建/生成此主题?
  3. 如果禁用 ACL 和配置传播,是否可以安全地假设它们AdminClient不用于其他任何用途?

在 MirrorMaker 代码中,偏移同步主题很容易在启动时创建MirrorSourceConnector,然后由MirrorSourceTask. 同样的情况也发生MirrorSourceConnector.

我没有找到关闭这些功能的方法,但老实说,我可能遗漏了一些想法。

apache-kafka apache-kafka-connect apache-kafka-mirrormaker

9
推荐指数
1
解决办法
3350
查看次数

我无法让 ipython 控制台在spyder 中播放声音

我一直在尝试使用 IPython 播放音频文件 (.wav),但听不到任何声音。

我该怎么做才能听到实际的声音?

这是代码:

import IPython
IPython.display.Audio("180960__kleeb__gunshot.wav")
Run Code Online (Sandbox Code Playgroud)

我期望听到声音,但我只得到这个结果:

Out[46]: <IPython.lib.display.Audio object>.
Run Code Online (Sandbox Code Playgroud)

python ipython playback spyder

6
推荐指数
1
解决办法
3360
查看次数

如何在Spark 2中使用HBase?

我正在从一个项目(在Scala中)更新版本,而Hbase出现了一些问题。我更新到的版本是:

  • Scala库-> 2.11.12
  • scalatest_2.11-> 3.0.8
  • spark-streaming_2.11-> 2.4.3
  • spark-sql_2.11-> 2.4.3
  • spark-hive_2.11-> 2.4.3

因此,由于始终存在相同的编译错误,因此我无法获得任何有效的hbase-spark:

错误:类路径中缺少符号“类型org.apache.spark.Logging”。“ org.apache.hadoop.hbase.spark.HBaseContext类”需要此符号。确保类路径中有Logging类型,并使用来检查冲突的依赖项-Ylog-classpath

如果针对不兼容版本的org.apache.spark编译了“ HBaseContext.class”,则完全重建可能会有所帮助。

val hBaseContext = new HBaseContext(sc, hBaseConf)
Run Code Online (Sandbox Code Playgroud)

hbase scala maven apache-spark apache-spark-2.0

5
推荐指数
0
解决办法
103
查看次数

Python Auto ARIMA 模型无法正常工作

我创建了一个具有有效 DatetimeIndex 的 pandas DataFrame

df.index = df.timestamp
df = df.resample("10Min", how="mean")
plt.plot_date(df.index, df['delay'])
fig = plt.gcf()
fig.set_size_inches(18.5, 8.5)
Run Code Online (Sandbox Code Playgroud)

它是这样的:

时间序列

模型拟合的相关属性:

df['delay'].head(5)

timestamp  
2016-10-30 04:30:00    32.000000  
2016-10-30 04:40:00    12.714286  
2016-10-30 04:50:00    36.941176  
2016-10-30 05:00:00    37.273381  
2016-10-30 05:10:00    38.960526  
Name: delay, dtype: float64
Run Code Online (Sandbox Code Playgroud)

然后我将 ARIMA 拟合到数据中:

import pmdarima as pm
import numpy as np
import matplotlib.pyplot as plt

df = df.dropna()

model = pm.auto_arima(df.delay, error_action='ignore', trace=1,
                      suppress_warnings=True,
                      seasonal=True, m=12)

model.plot_diagnostics(figsize=(7,5))
plt.show()
Run Code Online (Sandbox Code Playgroud)

诊断结果:

Fit ARIMA: order=(2, 0, 2) seasonal_order=(1, 0, 1, 12); …
Run Code Online (Sandbox Code Playgroud)

python arima forecast

5
推荐指数
1
解决办法
1万
查看次数