我们使用MirrorMaker2将一些主题从一个 Kerberized kafka 集群复制到另一个 kafka 集群(严格单向)。我们不控制源 kafka 集群,我们只能访问描述和读取要使用的特定主题。
MirrorMaker2 在源集群中创建并维护一个主题 ( mm2-offset-syncs),以对要复制的每个主题分区的集群到集群偏移映射进行编码,并且还在AdminClient源集群中创建一个主题来处理 ACL/Config 传播。因为 MM2 需要授权才能在源集群中创建和写入这些主题,或者通过 执行操作AdminClient,所以我试图了解为什么/是否需要在我们的场景中使用这些机制。
我的问题是:
AdminClient不用于其他任何用途?在 MirrorMaker 代码中,偏移同步主题很容易在启动时创建MirrorSourceConnector,然后由MirrorSourceTask. 同样的情况也发生在MirrorSourceConnector.
我没有找到关闭这些功能的方法,但老实说,我可能遗漏了一些想法。
我一直在尝试使用 IPython 播放音频文件 (.wav),但听不到任何声音。
我该怎么做才能听到实际的声音?
这是代码:
import IPython
IPython.display.Audio("180960__kleeb__gunshot.wav")
Run Code Online (Sandbox Code Playgroud)
我期望听到声音,但我只得到这个结果:
Out[46]: <IPython.lib.display.Audio object>.
Run Code Online (Sandbox Code Playgroud) 我正在从一个项目(在Scala中)更新版本,而Hbase出现了一些问题。我更新到的版本是:
因此,由于始终存在相同的编译错误,因此我无法获得任何有效的hbase-spark:
错误:类路径中缺少符号“类型org.apache.spark.Logging”。“ org.apache.hadoop.hbase.spark.HBaseContext类”需要此符号。确保类路径中有Logging类型,并使用来检查冲突的依赖项
-Ylog-classpath。如果针对不兼容版本的org.apache.spark编译了“ HBaseContext.class”,则完全重建可能会有所帮助。
Run Code Online (Sandbox Code Playgroud)val hBaseContext = new HBaseContext(sc, hBaseConf)
我创建了一个具有有效 DatetimeIndex 的 pandas DataFrame
df.index = df.timestamp
df = df.resample("10Min", how="mean")
plt.plot_date(df.index, df['delay'])
fig = plt.gcf()
fig.set_size_inches(18.5, 8.5)
Run Code Online (Sandbox Code Playgroud)
它是这样的:
模型拟合的相关属性:
df['delay'].head(5)
timestamp
2016-10-30 04:30:00 32.000000
2016-10-30 04:40:00 12.714286
2016-10-30 04:50:00 36.941176
2016-10-30 05:00:00 37.273381
2016-10-30 05:10:00 38.960526
Name: delay, dtype: float64
Run Code Online (Sandbox Code Playgroud)
然后我将 ARIMA 拟合到数据中:
import pmdarima as pm
import numpy as np
import matplotlib.pyplot as plt
df = df.dropna()
model = pm.auto_arima(df.delay, error_action='ignore', trace=1,
suppress_warnings=True,
seasonal=True, m=12)
model.plot_diagnostics(figsize=(7,5))
plt.show()
Run Code Online (Sandbox Code Playgroud)
诊断结果:
Fit ARIMA: order=(2, 0, 2) seasonal_order=(1, 0, 1, 12); …Run Code Online (Sandbox Code Playgroud)