小编use*_*271的帖子

Elasticsearch vs Cassandra vs Elasticsearch与Cassandra

我正在学习NoSQL,并根据我的客户要求查看不同的选项.在提出这个问题之前我已经经历了各种资源(一个对NoSQL知之甚少的人)

我需要以更快的速度存储数据并读取数据.
完全故障安全且易于扩展.
能够搜索Analytics的数据.

我最后得到了一份简短的清单: Cassandra and Elasticsearch

我所理解的是Cassandra对我来说是一个完美的NoSQL存储解决方案,因为我可以使用索引编写数据和读取数据.它失败或失败的地方是分析.在未来,如果我想从数据中获取数据from_date to to_date,或者有更多方法来获取分析数据,如果我没有正确设计数据模型或保持长期视野,这在不断变化的世界中可能会非常困难.

虽然Elastic Search最好是索引(由Lucene支持),并且可以通过抛出一些随机文本随机搜索数据.但即使我想检索数据from_date to to_date(我希望它可能是),它的工作原理是否相同.但真正的问题是,它是一个搜索引擎,还是完美的NoSQL数据存储,如Cassandra？如果是的话,为什么我们仍然需要Cassandra？

如果这两者都在不同的世界,请解释一下!我们如何将它们结合起来以获得更有效的解决方案？

lucene cassandra elasticsearch

Red*_*ddy

2016 12-30

105
推荐指数

3
解决办法

5万
查看次数

解决Apache Spark中的依赖性问题

构建和部署Spark应用程序时的常见问题是:

java.lang.ClassNotFoundException.
object x is not a member of package y 编译错误.
java.lang.NoSuchMethodError

如何解决这些问题？

java scala nosuchmethoderror classnotfoundexception apache-spark

use*_*271

2018 10-19

30
推荐指数

2
解决办法

1万
查看次数

Apache Cassandra远程访问

我在远程Ubuntu服务器上安装了Apache Cassandra.如何允许Apache Cassandra数据库的远程访问？以及如何建立连接？

remote-access cassandra

use*_*782

2016 12-29

25
推荐指数

3
解决办法

4万
查看次数

是否有任何与SQL相同的Cassandra查询:LIKE Condition？

该LIKE条件允许我们在SQL语句的where子句中使用通配符.这允许我们执行模式匹配.该LIKE条件可用于任何有效的SQL语句 - 选择,插入,更新或删除.像这样

SELECT * FROM users
WHERE user_name like 'babu%';

Run Code Online (Sandbox Code Playgroud)

与上面相同的操作一样,任何查询都可以在CLI中用于Cassandra.

sql cassandra pycassa

Bob*_*oid

2016 12-30

24
推荐指数

4
解决办法

5万
查看次数

Apache Cassandra 3.7 CQLSH'无法连接到任何服务器'

Apache cassandra 3.7版在Ubuntu服务器上运行16.04很好,apache cassandra的所有部分启动都没问题,问题是,我去连接使用cqlsh:$ CQLSH(我的IP地址)9160然后它说:连接错误:('无法连接到任何服务器,{'10 .0.0.13':TypeError('ref()不接受关键字参数',)})我看到它有一个错误:https: //issues.apache.org/ jira/browse/CASSANDRA-11850 但它的版本为cqlsh --version:cqlsh 5.0.1 cassandra -v:3.5(也发生在3.0.6)

有人评论我的Apache Cassandra票:https: //issues.apache.org/jira/browse/CASSANDRA-12402 说明:使用票证中描述的解决方法:如果您安装了最新的cassandra驱动程序,可以通过将环境变量CQLSH_NO_BUNDLED设置为任何非空字符串来禁用嵌入式驱动程序,例如export CQLSH_NO_BUNDLED = true.

问题是:

如何禁用最新的cassandra驱动程序？它在哪个目录？什么文件名？如果我禁用它,我将能够使用CQLSH连接？你们用什么工具连接到apache cassandra来运行命令等.除了CQLSH直接在服务器上？

cassandra cqlsh

Ste*_*veB

2016 12-28

14
推荐指数

1
解决办法

1万
查看次数

在线学习Spark中的LDA模型

有没有办法以在线学习的方式训练LDA模型,即.加载以前的火车模型,并用新文件更新？

machine-learning lda apache-spark apache-spark-ml apache-spark-mllib

mat*_*ieu

2017 03-18

9
推荐指数

1
解决办法

1245
查看次数

类型铸造Chararry中的异常在PIG中加倍

我有一个示例输入作为制表符分隔键,值对如下

B_1001@2012-06-15   96.73429163933419@0.5511284347710459
B_1001@2012-06-18   187.4348199976547@0.5544551559243536
B_1002@2012-09-26   745.4912066349087@0.8398570478932768
B_1002@2012-09-28   60.97117969729124@0.8500267379723409

Run Code Online (Sandbox Code Playgroud)

我正在将此文件加载到猪中并执行以下操作

a = load '/home/HadoopUser/Desktop/a.txt' as (key:chararray, value:chararray);

describe a;
a: {key: chararray,value: chararray}

b = foreach a generate key, flatten(STRSPLIT(value,'@',2)) as (v1:double,v2:float);
describe b;
b: {key: chararray,v1: double,v2: float}

c = group b by key;
 describe c;
c: {group: chararray,b: {key: chararray,v1: double,v2: float}}

Run Code Online (Sandbox Code Playgroud)

这工作到这里,但是当我在b.v1上使用数学计算时,我得到ClassCastException,因为java.lang.String无法转换为java.lang.Double

但描述没有错误

d = foreach c generate group,SUM(b.v1);
describe d;
d: {group: chararray,double}

Run Code Online (Sandbox Code Playgroud)

当我倾倒d; 它给了例外

我甚至尝试过类型转换'b'

b = foreach a generate key, (tuple (double,double))STRSPLIT(value,'@',2);

Run Code Online (Sandbox Code Playgroud)

现在当我描述b; 它给出了一个错误,因为无法将使用模式元组的元组转换为使用模式元组({double,double})的元组 …

hadoop mapreduce apache-pig

sud*_*eer

2016 12-26

8
推荐指数

1
解决办法

1万
查看次数

Apache Pig Latin参考手册

Pig是一个用于处理非常大的文件的数据流编程环境.猪的语言叫猪拉丁语.

有没有人知道PigLatin的好参考手册？我正在寻找包含该语言的所有语法和命令描述的内容.不幸的是,Pig wiki中的wiki页面被破坏了.

dataflow manual apache-pig

Ori*_*hav

2016 12-27

7
推荐指数

2
解决办法

1187
查看次数

如何使用Apache Kafka修复Python2.7中的"AssertionError:Value必须为字节"错误

我是Apache Kafka技术的新手.我试图通过使用python 2.7将消息作为JSON对象发送到kafka主题但我得到"AssertionError:Value必须是字节"错误.我可以成功地将消息作为字符串发送,我可以使用kafka-console-consumer.sh查看我的消息.我正在使用apache kafka 2.10-0.8.2.1版本.我在下面给出了我的代码.

from kafka import KafkaProducer
import yaml

producer = KafkaProducer(bootstap_servers="localhost:9092")
msg = yaml.safe_load('{"id":1, "name":"oguz"}')

producer.send("my-topic", msg)

Run Code Online (Sandbox Code Playgroud)

谢谢你的帮助.

python apache-kafka

Ogu*_*guz

2016 12-30

7
推荐指数

1
解决办法

5107
查看次数