我构建了一个测试集群,在运行节点工具状态时查看它,我将数据分布在四个节点之间,如下所示:
-- 地址加载代币拥有
联合国节点3 1.61 GB 1 14.6%
联合国节点2 3.14 GB 1 19.4%
联合国节点1 7.68 GB 1 63.9%
联合国节点4 5.85 GB 1 2.0%
现在,在我将数据提取到数据库之前,所有节点都已添加,但我认为我可能因为在将数据引入集群之前没有手动设置令牌信息而搞砸了。
我的问题是如何最好地重新调整以更均匀地分布数据?
是否有可能在同一个集群中有两个不同的 DSE 版本?就我而言,我有两个 DSE 5 节点的集群和两个 DSE 4.8.9 节点中的另一个。我能否将它们连接起来,以便将数据从 DSE 4.8.9 实时复制到 DSE 5?
我最近将 datastax-enterprise 从 4.8.16 升级到 5.0.15。我们使用纯文本格式的密码身份验证。但日志中不断出现以下消息。
2018-12-11 09:50:04.446 WARN [SharedPool-Worker-5 - com.datastax.bdp.cassandra.auth.DseAuthenticator:411] Plain text authentication without client / server encryption is strongly discouraged
2018-12-11 09:50:37.465 WARN [SharedPool-Worker-1 - com.datastax.bdp.cassandra.auth.DseAuthenticator:411] Plain text authentication without client / server encryption is strongly discouraged
2018-12-11 09:50:49.472 WARN [SharedPool-Worker-4 - com.datastax.bdp.cassandra.auth.DseAuthenticator:411] Plain text authentication without client / server encryption is strongly discouraged
2018-12-11 09:55:43.148 WARN [SharedPool-Worker-2 - com.datastax.bdp.cassandra.auth.DseAuthenticator:411] Plain text authentication without client / server encryption is strongly discouraged
2018-12-11 09:57:50.736 WARN [SharedPool-Worker-3 - com.datastax.bdp.cassandra.auth.DseAuthenticator:411] …Run Code Online (Sandbox Code Playgroud) 我是使用 Cassandra 的初学者。我创建了一个包含以下详细信息的表格,当我尝试使用令牌执行范围搜索时,我没有得到任何结果。我做错了什么还是我对数据模型的理解?
询问 select * from test where token(header)>=2 and token(header)<=4;
我在Mac OS X上使用Datastax cassandra发行版(dsc-cassandra-1.2.6).我想使用timeuuid类型,并正在尝试对它们进行查询.
这是我的表:
CREATE TABLE test_t (
canon_key text,
t timeuuid,
PRIMARY KEY (canon_key, t)
)
Run Code Online (Sandbox Code Playgroud)
现在让我说我得到一排.
cqlsh:pagedb> select canon_key, t, dateOf(t), unixTimestampOf(t) from test_t where canon_key = 'xxx' and t >= minTimeuuid('2013-08-08 18:43:58-0700');
canon_key | t | dateOf(t) | unixTimestampOf(t)
-----------+--------------------------------------+--------------------------+--------------------
xxx | 287d3c30-0095-11e3-9268-a7d2e09193eb | 2013-08-08 18:43:58-0700 | 1376012638067
Run Code Online (Sandbox Code Playgroud)
现在,我想删除这一行.我没有看到这样做的好方法,因为timeuuid类型没有相等运算符.
我添加的数据的性质是这样的,我(可能)甚至不介意这样做:
cqlsh:pagedb>从test_t中选择canon_key,t,dateOf(t),unixTimestampOf(t)其中canon_key ='xxx'和t> = minTimeuuid('2013-08-08 18:43:58-0700')和t < = maxTimeuuid('2013-08-08 18:43:58-0700');
但根据文档(http://cassandra.apache.org/doc/cql3/CQL.html#usingdates),这将无法正常工作.引述:"请注意,t> = maxTimeuuid('2013-01-01 00:05 + 0000')仍然不会选择在'2013-01-01 00:05 + 0000'生成的时间长度,并且基本上相当于t> maxTimeuuid('2013-01-01 00:05 + 0000')."
那么..我该如何删除这一行?
我正在尝试使用5个节点设置cassandra集群.我在所有节点上安装了dse,并通过命令在所有节点上启动了dse.
sudo service dse start
dse在所有节点上运行正常.
现在我尝试按照http://www.datastax.com/documentation/opscenter/3.2/webhelp/index.html#opsc/install/../../opsc/install/opscInstallRHEL_t.html配置opscenter
当我执行"sudo service opscenterd start"时,它启动没有任何问题,甚至日志也没有显示任何问题.
但是当我尝试做"netstat -a | grep 8888"时,它并没有显示任何监听器.
有人可以帮我识别问题吗?
谢谢,珍妮丝
我们有几个表格采用Leveled压缩策略和SizeTiered压缩策略.我们多久需要进行一次压实?提前致谢
在我们当前的基础架构中,我们使用Cassandra集群作为我们的后端数据库,并且通过Solr,我们使用Web UI为客户在必要时对我们的数据库执行读取查询.
我被要求将Spark视为未来可以实现的东西,但我很难理解它将如何改进我们目前的工作.
所以我的基本问题是:
1)Spark是否会取代Solr来查询数据库,就像用户在我们的网站上查找内容一样?
2)只是一个总的想法,什么类型的基础设施将是必要的,以改善我们的现状(5个Cassandra节点,所有这些节点也运行Solr).换句话说,我们很容易看到构建另一个只有Spark节点的集群?
3)Spark节点可以在与Cassandra相同的物理机器上运行吗?我猜这是一个坏主意,因为内存限制因为我对Spark的基本理解是它在内存中做了所有事情.
4)我可以用什么好的快速/基本资源来开始弄清楚Spark如何让我们受益?我可以访问Datastax Academy课程,所以我正在阅读这些课程,只是想知道是否还有其他任何可以帮助我的研究.
基本上,一旦我弄清楚它是什么,更重要的是我们可以如何利用我们的优势,我将开始玩一些测试实例,但我应该首先熟悉基础知识.
对于 cassandra 中的用户,我使用以下命令获得了权限:
PRICINGUSR@cqlsh:system> LIST ALL PERMISSIONS OF PRICINGUSR;
username | resource | permission
------------+--------------------+------------
PRICINGUSR | <keyspace pricing> | CREATE
PRICINGUSR | <keyspace pricing> | ALTER
PRICINGUSR | <keyspace pricing> | DROP
PRICINGUSR | <keyspace pricing> | SELECT
PRICINGUSR | <keyspace pricing> | MODIFY
PRICINGUSR | <keyspace pricing> | AUTHORIZE
Run Code Online (Sandbox Code Playgroud)
注意:系统密钥空间没有权限。
但是,当我查询系统键空间表中的某些表时,我得到了响应,而另一些则没有。
PRICINGUSR@cqlsh:system> Select * from system.schema_keyspaces limit 1;
keyspace_name | durable_writes | strategy_class | strategy_options
---------------+----------------+------------------------------------------------------+------------------
ccw_pd | True | org.apache.cassandra.locator.NetworkTopologyStrategy | {"DC1":"3"}
(1 rows)
PRICINGUSR@cqlsh:system> Select * …Run Code Online (Sandbox Code Playgroud) 我在Ubuntu 16.04 LTS上安装了Ops Center 6.0.
我正在使用Lifecycle Manager使用DataStax Public存储库在Ubuntu 16.04 LTS上配置新的DSE 5.0.3集群.
Ops Center和DSE群集节点都在Amazon EC2中运行
我使用DataStax登录凭据在LCM中配置了存储库.
但是,LCM在尝试访问存储库时报告HTTP 401错误.
2016-11-14 08:02:46,975 [opscenterd] ERROR: Received error from node event-subtype="meld-error" job-id="71c7e70d-3c1d-479b-b1e1-dabb71758c33" name="Cassandra1" ssh-management-address="xxx.xxx.xxx.xxx" node-id="20cbe1cc-61f3-4218-b73d-cdd71167d488" event-type="error" message="Received an HTTP 401 Unauthorized response while attempting to access the package repository. Check your repository credentials." (opscd-pool-0)
Run Code Online (Sandbox Code Playgroud)
这里有一些工作细节和事件详细信息屏幕截图:
我已经检查过,我现在多次提供了正确的凭证,我非常自信我没有犯错.
此外,在报告错误的其中一个节点上,我创建了一个具有相同凭据的/etc/apt/sources.list.d/datastax.sources.list文件,使用curl下载DataStax存储库密钥,并成功安装手动DSE包.这表明我的凭据和与DataStax存储库的连接很好.
我目前有点卡住,所以如果有人能提供任何帮助,如何解决这个问题,将不胜感激.
谢谢
奥斯汀
我已经在Google云端部署了9个节点的集群。
创建一个表并加载数据。现在要更改表名称。
有什么办法可以更改Cassandra中的表名吗?
谢谢
请告诉一个简单的解决方案,因为我有数百万个节点,所以需要更少的时间:
for(int i=1100000; i<=1200000;i++){
GraphStatement q1 = new SimpleGraphStatement("g.addV(label, 'Asset','name','Asset"+i+"','type','"+1+"').as('a')").setGraphName("lookingglass");
System.out.println("Added node----"+i);
}
for(int i=1100000;i<=1200000;i++){
//int j=i+1;
Vertex v1 = dseSession.executeGraph("g.V().has('name','Org"+1000+"')").one().asVertex();
Vertex v2 = dseSession.executeGraph("g.V().has('name','Asset"+i+"')").one().asVertex();
SimpleGraphStatement s = new SimpleGraphStatement(
"def v1 = g.V(id1).next()\n" +
"def v2 = g.V(id2).next()\n" +
"v1.addEdge('HAS', v2)")
.set("id1", v1)
.set("id2", v2);
dseSession.executeGraph(s);
System.out.println("Added Edge "+i);
}
System.out.println("Done");
Run Code Online (Sandbox Code Playgroud)
由于我正在进行整个图搜索,这需要更长的时间。我们是否可以有一个简单的单个查询来添加一个 vartex 并将一条边从该查询添加到现有顶点,从而减少延迟?
注意我也尝试过以下方法,但以下方法似乎已被废弃,因此给出错误(Vertex 不支持用户提供的标识符:
g.addV().property(id, "A").as("a").
addV().property(id, "B").property("value", 100).as("b").
addV().property(id, "C").property("value", 200).as("c").
addV().property(id, "D").property("value", 500).as("d").
addV().property(id, "E").property("value", 1000).as("e").
addV().property(id, "Z").property("value", 900).as("z").
addE("link").from("a").to("b").property("weight", 80).
addE("link").from("a").to("c").property("weight", 20).
addE("link").from("b").to("d").property("weight", 50). …Run Code Online (Sandbox Code Playgroud) cassandra gremlin datastax-enterprise tinkerpop3 datastax-enterprise-graph
cassandra ×12
datastax ×6
cql ×2
opscenter ×2
apache-spark ×1
cqlsh ×1
gremlin ×1
tinkerpop3 ×1