小编Lil*_*yAZ的帖子

如何使用kafka-python计算主题中的记录(消息)数量

正如标题中所说,我想在我的主题中获得一些记录,但我找不到使用 kafka-python 库的解决方案。有人有什么主意吗 ?

python apache-kafka kafka-python

6
推荐指数
1
解决办法
1万
查看次数

将 printSchema() 函数的结果保存到 Pyspark 中的变量中?

我正在使用该printSchema函数来推断 Json 文件的架构。我想将此函数调用的结果保存在一个变量中,以便逐行解析它,以便我可以提取模式结构并将其转换为 DDL 模式,以便在 hive 中创建表。

如何才能做到这一点?

ddl apache-spark pyspark

2
推荐指数
1
解决办法
4486
查看次数

更改保留策略主题 kafka

我想将一个主题的默认保留时间更改为“rentention.ms=100”,但我在 python 中找不到解决方案。有人可以帮我吗,拜托?

python apache-kafka

2
推荐指数
1
解决办法
3215
查看次数

标签 统计

apache-kafka ×2

python ×2

apache-spark ×1

ddl ×1

kafka-python ×1

pyspark ×1