我在Java应用程序中使用Redis,我正在读取日志文件,在Redis中为每个日志存储/检索一些信息.密钥是我的日志文件中的IP地址,这意味着它们始终是新闻密钥,即使它们经常出现.
在某些时候,Redis达到了它的最大大小(在我的情况下为3gb),并开始驱逐一些键.我使用"allkeys-lru"设置,因为我想保留最年轻的密钥.
然后整个应用程序放慢了很多,比开始时长5倍.所以我有三个问题:
编辑1:我们在Redis中使用2个DB
编辑2:我们使用redis 2.2.12(ubuntu 12.04 LTS).进一步的调查解释了这个问题:我们在redis中使用db0和db1.db1的使用远小于db0,键完全不同.当Redis达到max-memory(并且LRU algo开始驱逐密钥)时,redis会删除几乎所有db1密钥,这会大大减慢所有调用.这是一种奇怪的行为,可能不常见,可能与我们的应用程序有关.我们通过转移到db1中加载的密钥的另一个(更好的)内存机制来解决问题.
谢谢 !
我们正在处理来自我们在HDFS上添加的多个服务器的大型日志文件.我们目前有一个很好的批处理解决方案(主要是每天移动和编写文件),并希望用Kafka实现实时解决方案.
基本上,我们需要将来自Nginx的日志放入Kafka,然后写一个消费者在HDFS上写(这可以通过HDFS消费者来完成https://github.com/kafka-dev/kafka/tree/master/contrib/ hadoop-consumer).
您建议将日志移至Kafka的方法是什么?
还有其他想法吗?