Cassandra多功能表现

Chr*_*rle 3 cassandra pycassa

我有一个cassandra集群,行数相当少(200万左右,我希望cassandra"小").每行都键入一个唯一的UUID,每行有大约200列(给出或取一些).总而言之,这些是非常小的行,没有二进制数据或大量文本.只是短串.

我刚从旧数据库中完成了对cassandra集群的初始导入.我已经在每台机器上调整了cassandra的地狱.有数亿次写入,但没有读取.现在是时候使用这个东西了,我发现读取速度绝对令人沮丧.我正在使用pycassa在一个500到10000行的任何地方进行多项目.即使在500行,性能也很糟糕,有时需要30秒以上.

什么会导致这种行为?在像这样大量导入之后,你会推荐什么样的东西?谢谢.

jbe*_*lis 6

听起来像是你的瓶颈.如果您的数据适合ram,Cassandra每核心大约需要4000次读取/秒.否则你会像其他任何东西一样受到追捕.

我注意到,通常从系统中"调整地狱"是为了开始加载它之后保留的.:)

看到: