我正在研究Spark(伯克利)集群计算系统.在我的研究中,我了解了其他一些内存系统,如Redis,Memcachedb等.如果有人能给我SPARK和REDIS(以及MEMCACHEDB)之间的比较,那将会很棒.在什么情况下Spark比其他内存系统有优势?
由于这是我的第一篇文章,似乎我只能发布1个链接,所以我列出了我在底部指的网站.简而言之,我的目标是让数据库更快地返回结果,我试图包含尽可能多的相关信息,以帮助构建帖子底部的问题.
8 processors
model name : Intel(R) Xeon(R) CPU E5440 @ 2.83GHz
cache size : 6144 KB
cpu cores : 4
top - 17:11:48 up 35 days, 22:22, 10 users, load average: 1.35, 4.89, 7.80
Tasks: 329 total, 1 running, 328 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.0%us, 0.0%sy, 0.0%ni, 87.4%id, 12.5%wa, 0.0%hi, 0.0%si, 0.0%st
Mem: 8173980k total, 5374348k used, 2799632k free, 30148k buffers
Swap: 16777208k total, 6385312k used, 10391896k free, 2615836k cached
Run Code Online (Sandbox Code Playgroud)
但是,我们正在考虑将mysql安装移动到具有256 GB RAM的群集中的其他计算机
我的MySQL表看起来像
CREATE …Run Code Online (Sandbox Code Playgroud) 通过计数器,它可以是网页浏览量,下载量,投票数等.基本上,不是非常"关键"的数据.
存储这些信息的"最佳"方式是什么?Mysql不是一个好选择.你们用的是什么?
我正在尝试将大量数据加载到 memcachedb 中。我正在 MySQL 数据库上运行一些查询,我想将这些查询的结果存储在 memcachedb 中,以便以后轻松访问。
目前,我只是使用简单的 set 命令将结果存储在 memcachedb 中,但由于这些结果有数十亿个,将它们一一存储在循环中是非常低效且耗时的。所以,我想知道是否有更好的方法将数据加载到memcachedb中?就像传统RDMS中的数据导入向导
我正在使用 pylibmc 连接到 memcachedb。
出于同样的原因,在一个应用程序中同时使用NoSQL和RDBMS是有意义的,除了NoSQL缓存之外,我还有一个RDBMS缓存.
我正在考虑使用MySQL服务器和所有使用内存引擎的表.
这种方法有什么警告吗?
只是为了澄清,我建议这里仅使用MySQL服务器进行缓存,而不是用于我的应用程序的实际数据存储.
memcachedb ×5
caching ×2
mysql ×2
redis ×2
apache-spark ×1
apache-storm ×1
libmemcached ×1
memcached ×1
memory-table ×1
php ×1
python ×1
subquery ×1