Redis - 为什么这段代码很快？

最近我使用Redis.Eval改进了一些代码,效果很好.事实上,这工作得太好了,但我不明白这是怎么回事.

对于TL; DR

改进的redis代码多次使用Redis.zcard来使用Redis.eval一次.代码的速度提高了100倍(在测试环境中.在实际项目中,速度提高了1000倍以上).我不知道为什么.有人可以解释一下吗？

什么代码

它做了一个非常简单的任务.它需要一个字符串数组,它是存储在Redis中的ZSET的关键字,并对相应ZSET的大小求和,并返回一个整数值,即和.

测试设置

为了尽可能多地消除外部变量,我建立了一个简单的测试环境,如下所示.

redis = Redis.new(host: '127.0.0.1', db: 1)
KEYS = 500.times.collect do |i| "KEY#{i}" end
KEYS.each do |key|
  redis.zadd(key, 0, "DATA")
end

Run Code Online (Sandbox Code Playgroud)

改善之前

在我更改代码之前,它的工作原理如下.

sum = 0
KEYS.each do |key|
  sum += redis.zcard(key)
end

Run Code Online (Sandbox Code Playgroud)

然后我使用以下单行代码测试了此代码的速度.
t = Time.now; sum=0; KEYS.each do |key| sum += redis.zcard(key) end; puts(Time.now - t)
结果打印出来0.202seconds(202ms)
(请注意我根据测试环境和上面编写的代码计算时间,而不是真实环境)

改善之后

在我使用Lua脚本和EVAL更改代码之后,它的工作原理如下.

script = " 
local sum = 0
for index, key in pairs(KEYS) do
  sum = sum + redis.call('zcard', key);
end …

Run Code Online (Sandbox Code Playgroud)

ruby performance lua nosql redis

Che*_*eon

2017 09-23

3
推荐指数

1
解决办法

347
查看次数

Hive:在主表上执行递增更新的最佳方法

所以我在Hive中有一个主表,它将存储我的所有数据.

我希望能够每月加载大量数据数十亿行的增量数据更新.将有新数据和更新的条目.

解决此问题的最佳方法是什么,我知道Hive最近升级并支持更新/插入/删除.

我一直在想的是以某种方式找到将要更新的条目并从主表中删除它们然后只插入新的增量更新.但是在尝试此操作后,插入速度非常快,但删除速度非常慢.

另一种方法是使用update语句执行某些操作以匹配主表和增量更新中的键值并更新其字段.我还没试过这个.这听起来也很痛苦,因为Hive必须逐个更新每个条目.

任何人都有任何想法,如何最有效和最有效地做到这一点？我对Hive和数据库很新.

java hadoop hive nosql

Ale*_*lex

2017 09-23

3
推荐指数

1
解决办法

1977
查看次数

将ElasticSearch用作社交应用程序与图形数据库的nosql数据库有哪些缺陷？

我们公司有几个产品和几个团队.一个团队负责搜索,并将Elasticsearch标准化为nosql数据库以存储他们的所有数据,并计划稍后使用Neo4j来赞美他们的搜索关系数据.

我的团队负责社交应用程序的产品方面(人们有朋友,为公司工作,并且将与在公司工作的每个人一起成为同事).我们将图dbs视为一种解决方案(在放弃rdbms中n ^ 2关系的燃烧船之后),特别是neo4j(Cypher查询语言是一件很棒的事情).

我们的数据子集与搜索团队使用的数据类似,我们需要确保搜索可以同时搜索他们的数据和数据.搜索团队正在推动我们为我们的db而不是Neo4j或任何图形数据库标准化ElasticSearch.我相信这是为了标准化和一致性.

我们显然来自非常不同的地方,搜索问题与产品问题.他断言ElasticSearch可以涵盖我们的所有用例,包括类似图形的查询以查找建议.虽然这可能是真的,但我真的希望坚持使用Neo4j,并使用ElasticSearch插件与他们的搜索集成.

在这种情况下,对于产品数据库而言,选择ElasticSearch而非Neo4j是否存在任何重大问题(反之亦然)？那些处于类似情况的人的指导方针或轶事？

neo4j nosql graph-databases elasticsearch

Inv*_*con

2017 09-23

3
推荐指数

1
解决办法

2318
查看次数

如何使用Java在MongoDB 3.3中通过_id删除文档

我有一个问题,想知道如何通过MongoDB中的_id删除文档.我可以通过其他属性删除没问题但我似乎缺少正确的语法删除_id.

我的文档格式如下:

{ "_id" : { "$oid" : "57a49c6c33b10927ff09623e" }, "name" : "Brad" }

Run Code Online (Sandbox Code Playgroud)

这是我正在使用的Java代码:

// Boiler plate
MongoClient client = new MongoClient( "localhost" , 27017 );
MongoDatabase db = client.getDatabase("my-database");
MongoCollection<Document> collection = db.getCollection("my-collection")

// This works
collection.deleteOne(new Document("name", "Brad"));

// This does not work
collection.deleteOne(new Document("_id", "57a49c6c33b10927ff09623e"));

Run Code Online (Sandbox Code Playgroud)

任何人都知道我哪里出错了？

java mongodb nosql

win*_*ama

2017 09-23

3
推荐指数

1
解决办法

7378
查看次数

在MongoDB中使用MapReduce加入两个集合

我已经知道MongoDB不支持连接操作,但我必须$lookup使用mapReduce范例模拟(来自聚合框架).

我的两个系列是:

// Employees sample 
{
  "_id" : "1234",
  "first_name" : "John",
  "last_name" : "Bush",
  "departments" : 
  [ 
    { "dep_id" : "d001", "hire_date" : "date001" },
    { "dep_id" : "d004", "hire_date" : "date004" }
  ]
}
{ 
  "_id" : "5678", 
  "first_name" : "Johny", 
  "last_name" : "Cash", 
  "departments" : [ { "dep_id" : "d001", "hire_date" : "date03" } ] 
}
{ 
  "_id" : "9012", 
  "first_name" : "Susan", 
  "last_name" : "Bowdy", 
  "departments" : [ { "dep_id" : "d004", …

Run Code Online (Sandbox Code Playgroud)

lookup join mapreduce mongodb nosql

Vzq*_*van

2017 09-23

3
推荐指数

1
解决办法

3187
查看次数

我们可以使用弹性搜索作为快速检索数据的缓存吗？

我想建立一个必须实时回答查询的系统。我将不得不每1小时更新一次数据，并且必须添加大约一百万个文档。我们可以使用弹性搜索还是应该使用nosql？

caching nosql elasticsearch

mar*_*308

2017 09-23

3
推荐指数

2
解决办法

2465
查看次数

Cassandra并发写道

当并发写入发生时,Cassandra如何保证最终的一致性？

例如,客户端A写入tableA.rowA.colA,同时客户端B写入tableA.rowA.colA.

协调器节点将请求分发给副本节点,例如NodeA NodeB和NodeC.

在NodeA上,ClientA请求首先到达.在NodeB上,ClientB请求首先到达.那么,它会永远不一致吗？

eventual-consistency cassandra nosql

use*_*415

2017 09-23

3
推荐指数

1
解决办法

1742
查看次数

在Cassandra中建立一对多关系的最佳方法是什么？

假设我要设计一个系统，用户可以在其中创建帖子，每个帖子都属于一个用户，但一个用户可能有多个帖子。还假设除了要简单地通过postId查找帖子外，我还希望支持查找具有给定userID的所有帖子。我还想存储用户特定的帐户详细信息，例如帐户创建日期。

一种建模方法如下：

CREATE TABLE user (
   userId int,
   name varchar,
   userDetail1,
   userDetail2,
   ...,
   PRIMARY KEY(userId)
);

CREATE TABLE post (
   postId int,
   postDetail1,
   postDetail2,
   ...,
   userId int,
   PRIMARY KEY(postId)
);

Run Code Online (Sandbox Code Playgroud)

据我所读，这不是最佳方法，因为查询特定用户发表的帖子会导致内存效率低下。它是否正确？这是Cassandra不支持在userId上索引发布表的原因吗？

那么理想的解决方案如下吗？

CREATE TABLE user (
   userId int,
   name varchar,
   userDetail1,
   userDetail2,
   ...,
   PRIMARY KEY(userId)
);

CREATE TABLE post (
   postId int,
   postDetail1,
   postDetail2,
   ...,
   userId int,
   PRIMARY KEY(postId)
);

CREATE TABLE user_to_post (
   userId int,
   postId int,
   userDetail1,
   userDetail2,
   ...,
   postDetail1,
   postDetail2,
   ...,
   PRIMARY KEY(userId, postId)
);

Run Code Online (Sandbox Code Playgroud)

使用组合键，查询特定用户的帖子效率更高。但是，采用这种设计，专门为发帖设置表格是否多余？同样，在这种设计中，我希望查找特定用户发布的帖子，并且还希望快速链接到给定帖子的特定用户。我已经读了很多书，但是对于如何在Cassandra中精确设计一对多关系感到非常困惑。

composite-key one-to-many cassandra nosql

Lee*_*ren

2017 09-23

3
推荐指数

1
解决办法

1306
查看次数