我正在评估什么是最好的迁移选项.
目前,我正在使用分片MySQL(水平分区),我的大部分数据都存储在JSON blob中.我没有任何复杂的SQL查询(自从我对数据库进行分区后已经迁移过了).
现在,似乎MongoDB和Cassandra都可能成为选择.我的情况:
我一直在阅读网络上的文章,以了解以下key类型之间的差异.但这对我来说似乎很难掌握.实例肯定有助于更好地理解.
primary key,
partition key,
composite key
clustering key
Run Code Online (Sandbox Code Playgroud) 最近有很多关于卡桑德拉的谈话.
Twitter,Digg,Facebook等都使用它.
什么时候有意义:
我是Cassandra的新手,并尝试使用Cassandra实现一个玩具应用程序.我在Cassandra DB中创建了一个键空间和几个列族,但我忘记了我的簇的名称.
我试图找到是否有任何查询可以列出所有可用的键空间.
有谁知道这样的查询或命令?
使用基于文档的NoSQL选项会让您在KV商店购买什么,反之亦然?
在BigTable/GFS和Cassandra术语中,SSTable的定义是什么?
我正在学习NoSQL,并根据我的客户要求查看不同的选项.在提出这个问题之前我已经经历了各种资源(一个对NoSQL知之甚少的人)
我最后得到了一份简短的清单: Cassandra and Elasticsearch
我所理解的是Cassandra对我来说是一个完美的NoSQL存储解决方案,因为我可以使用索引编写数据和读取数据.它失败或失败的地方是分析.在未来,如果我想从数据中获取数据from_date to to_date,或者有更多方法来获取分析数据,如果我没有正确设计数据模型或保持长期视野,这在不断变化的世界中可能会非常困难.
虽然Elastic Search最好是索引(由Lucene支持),并且可以通过抛出一些随机文本随机搜索数据.但即使我想检索数据from_date to to_date(我希望它可能是),它的工作原理是否相同.但真正的问题是,它是一个搜索引擎,还是完美的NoSQL数据存储,如Cassandra?如果是的话,为什么我们仍然需要Cassandra?
如果这两者都在不同的世界,请解释一下!我们如何将它们结合起来以获得更有效的解决方案?
我知道有三种不同的,流行的非SQL数据库类型.
我已经阅读了很多关于它的博客而没有那么多了解.
我知道关系数据库,并掌握基于文档的数据库,如MongoDB/CouchDB.
有人能告诉我这些与名单上的两位前者之间的主要区别是什么?
在尝试使用Cassandra时,我发现Cassandra会监听以下端口:
Cassandra如何使用列出的每个端口?
在研究了大规模数据存储解决方案之后,我几乎落在了卡桑德拉.但它普遍认为Hbase是大规模数据处理和分析的更好解决方案.
虽然两者都是相同的键/值存储,并且两者都是/可以运行(最近的Cassandra)Hadoop层,但是当大数据需要处理/分析时,Hadoop是更好的候选者.
我也在http://ria101.wordpress.com/2010/02/24/hbase-vs-cassandra-why-we-moved/找到了关于这两方面的详细信息.
但我仍然在寻找Hbase的具体优势.
虽然我更加信服Cassandra,因为它简单易用,无需添加节点和无缝复制,也没有故障点功能.它还保留了二级索引功能,因此它是一个很好的优点.