小编Jac*_*ack的帖子

Hbase需要多长时间才能恢复一个崩溃的RegionServer

看来Hbase RegionServer是单个节点,不像Cassandra那样有复制节点.我知道当一个RegionServer关闭时,HMaster会将崩溃的RS上的区域分配给其他RS.

但是新的RegionServer准备好服务崩溃的区域需要多长时间,如果花了太长时间,客户端不能等待太长时间,客户端会抛出异常甚至丢失的数据,对吧？

hbase

Jac*_*ack

2016 04-16

7
推荐指数

1
解决办法

1885
查看次数

如何更改Kafka经纪人列表ip

我有3个Kafka经纪人在一个孤立的网络区域运行,我的客户端无法直接连接它们,所以我必须使用VIP(虚拟IP)来连接经纪人.

例如:

我的经纪人的IP是:10.5.1.5, 10.5.1.6, 10.5.1.7,

我的VIP的IP是:200.100.1.5, 200.100.1.6, 200.100.1.7,他们一对一配对.

因此,当我指示引导列表为200.100.1.5,群集响应我混合的VIP和Broker ips,例如:10.5.1.5, 10.5.1.6, 200.100.1.5, 200.100.1.6 ...,然后连接失败,因为我的程序无法到达经纪人的IP,只能到达VIP.

我目前的配置如下,它同时响应IP和VIP:

listeners=INTERNAL://:9092,EXTERNAL_PLAINTEXT://:8080

advertised.listeners=EXTERNAL_PLAINTEXT://200.100.1.5:8080,INTERNAL://10.5.1.5:9092

listener.security.protocol.map=INTERNAL:PLAINTEXT,EXTERNAL_PLAINTEXT:PLAINTEXT

inter.broker.listener.name=INTERNAL

Run Code Online (Sandbox Code Playgroud)

我怎样才能让卡夫卡只回复贵宾名单.

我有答案,可能是以下内容:

advertised.listeners=PLAINTEXT://200.100.1.5:8080
listeners=PLAINTEXT://10.5.1.5:9092
And remove the listener.security and inter.broker.

Run Code Online (Sandbox Code Playgroud)

apache-kafka

Jac*_*ack

2018 06-21

7
推荐指数

1
解决办法

3079
查看次数

关于删除Kafka主题的困惑

我正在使用Kafka 0.8.0,它是Cloudera版本.当我删除以下主题时:kafka-topics --zookeeper 10.0.0.11:2181/ --delete --topic test 它响应:

Topic test is already marked for deletion.

Run Code Online (Sandbox Code Playgroud)

但之后我重新创建它,它抛出异常如下:

kafka-topics --create --zookeeper 10.0.0.11:2181 --partitions 90 --replication-factor 2 --topic test

Error while executing topic command Topic "test" already exists.
kafka.common.TopicExistsException: Topic "test" already exists.

Run Code Online (Sandbox Code Playgroud)

有什么想法吗？我该如何删除主题及其数据.

apache-kafka

Jac*_*ack

lucky-day

6
推荐指数

2
解决办法

2万
查看次数

ElasticSearch和Lucene如何共享内存

我对ES官方文档中的以下配额有一个问题:

But if you give all available memory to Elasticsearch’s heap, 
there won’t be any left over for Lucene. 
This can seriously impact the performance of full-text search.

Run Code Online (Sandbox Code Playgroud)

如果我的服务器有80G内存,我发出以下命令来启动ES节点:bin/elasticsearch -xmx 30g 这意味着我只给ES 30g内存最大进程.Lucene如何使用左侧50G,因为Lucene在ES过程中运行,它只是过程的一部分.

lucene elasticsearch

Jac*_*ack

lucky-day

6
推荐指数

1
解决办法

2384
查看次数

如何通过 python api 在 opensearch 中更新插入文档

我尝试将文档更新插入到 Opensearch，这意味着如果不存在 id，它将插入文档，如果 id 已经存在，它将更新文档（不会覆盖）。

例如，如果文档已经在 Opensearch 中{"id":1,"name":"Jack"}，当我更新插入时{"id":1,"job":"engineer"}， opensearch 中的文档将变成{"id":1,"name":"Jack","job":"engineer"}，而不仅仅是被覆盖。

我尝试使用 doc_as_upsert 进行 python index api，如下所示，但失败了：

pyClient.index(
            index = indexName,
            body = document,
            id = document['id'],
            refresh = True,
            doc_as_upsert = True
        )

Run Code Online (Sandbox Code Playgroud)

文档对象是：{"id":"123","name":"Jack","job":"Engineer"}

python opensearch

Jac*_*ack

2022 09-19

6
推荐指数

1
解决办法

3708
查看次数

对不起,伙计,只是一个简单的问题,但我无法在谷歌上找到确切的问题.关于什么是dfs.replication的问题是什么意思？如果我在hdfs中创建了一个名为filmdata.txt的文件,如果我设置了dfs.replication = 1,那么它是完全一个文件(一个是filmdata.txt)吗？还是主文件(filmdata.txt)hadoop会创建另一个复制文件.不久之后说:如果设置dfs.replication = 1,总共有一个filmdata.txt,或者两个filmdata.txt？提前致谢

hadoop hdfs

Jac*_*ack

lucky-day

5
推荐指数

2
解决办法

1万
查看次数

我对 MySQLdb 服务器端游标和客户端游标感到困惑

我正在使用 python-mysql(MySQLdb) 来查询 Mysql 服务器。游标模块有两种：一种是客户端游标，如：

cursor = db.cursor(MySQLdb.cursors.DictCursor)

Run Code Online (Sandbox Code Playgroud)

另一种是服务器端游标，如：

cursor = db.cursor(MySQLdb.cursors.SSDictCursor)

Run Code Online (Sandbox Code Playgroud)

文档说服务器端游标意味着Mysql会在mysql服务器端缓存一些结果，然后将它们发送到客户端。我对此很困惑，比方说，如果我想杀死一台 mysql 服务器，我可以使用多个服务器端游标，然后 mysql 就会因为内存耗尽而死掉。此外，服务器大小光标有任何意义吗？默认情况下，Mysql 机制是当 mysql 检索到一条记录时，它会立即将其发送给客户端。缓存结果然后将其发送出去是否有意义？

我真的不知道应该使用哪个游标，客户端游标还是服务器端游标？

mysql mysql-python database-cursor

Jac*_*ack

2022 03-24

5
推荐指数

1
解决办法

3391
查看次数

Elasticsearch 中二进制数据类型的用例

我正在尝试将二进制数据存储到 Elasticsearch。请教几个问题：

二进制列很大（50MB），可以存储在ES中吗？
我还需要从ES获取二进制数据，它会对性能产生多大的影响。
binary patten我可以通过诸如 0000111或 Base64 格式查询二进制列吗？
人们希望使用 ES 存储二进制数据的真正用例是什么？

elasticsearch

Jac*_*ack

lucky-day

5
推荐指数

0
解决办法

752
查看次数

什么是 HDFS 写入一致性

HDFS是否像Cassandra一样具有写入一致性，比如说我写完一个文件到HDFS，什么时候会得到成功的响应，是第一次复制完成还是3次复制完成？（假设rep=3）

hadoop hdfs

Jac*_*ack

lucky-day

5
推荐指数

1
解决办法

3406
查看次数

Kafka模式注册表在同一主题中不兼容

我正在使用Kafka模式注册表来生成/使用Kafka消息，例如，我有两个字段均为字符串类型，伪模式如下所示？

{"name": "test1", "type": "string"}
{"name": "test2", "type": "string"}

Run Code Online (Sandbox Code Playgroud)

但是在发送和使用了一段时间之后，我需要修改架构以将第二个字段更改为long类型，然后引发以下异常：

Schema being registered is incompatible with an earlier schema; error code: 409

Run Code Online (Sandbox Code Playgroud)

我很困惑，如果架构注册表无法发展架构升级/更改，那为什么我应该使用架构注册表，或者为什么要使用Avro？

avro apache-kafka confluent confluent-schema-registry

Jac*_*ack

2019 06-30

5
推荐指数

4
解决办法

7434
查看次数

标签统计

apache-kafka ×3

elasticsearch ×2

hadoop ×2

hdfs ×2

avro ×1

confluent ×1

confluent-schema-registry ×1

database-cursor ×1

hbase ×1

lucene ×1

mysql ×1

mysql-python ×1

opensearch ×1

python ×1

小编Jac_ack的帖子

Hbase需要多长时间才能恢复一个崩溃的RegionServer

如何更改Kafka经纪人列表ip

关于删除Kafka主题的困惑

ElasticSearch和Lucene如何共享内存

如何通过 python api 在 opensearch 中更新插入文档

Hadoop dfs复制

我对 MySQLdb 服务器端游标和客户端游标感到困惑

Elasticsearch 中二进制数据类型的用例

什么是 HDFS 写入一致性

Kafka模式注册表在同一主题中不兼容

标签统计

标签 统计

小编Jac_ack的帖子

标签统计