标签: vertica

如何获取 Vertica 数据库的大小?

我有一个 Vertica 数据库。我怎么知道数据库有多大?

我需要一个粗略的答案,以便向高层管理人员报告有关我们环境的基本统计数据。

database-size vertica

7
推荐指数
1
解决办法
2万
查看次数

成对交叉点

我有一个包含两列的表,比如说名字和姓氏。我需要另一个表,其中对于第一对中的每一对名字,都包含共同姓氏的计数。

这在 SQL 中可行吗?

如果姓氏的唯一性会影响查询的效率,则姓氏的唯一性比名字的唯一性要多得多。

一个玩具示例,输入:

FirstName, LastName
John, Smith
John, Doe
Jane, Doe
Run Code Online (Sandbox Code Playgroud)

输出:

FirstName1, FirstName2, CommonLastNames
John, John, 2
John, Jane, 1
Jane, Jane, 1
Jane, John, 1
Run Code Online (Sandbox Code Playgroud)

由于这种关系是自反且对称的,因此如果结果只是三角形之一(例如,对角线上方的三角形)也没关系。

vertica

4
推荐指数
1
解决办法
986
查看次数

Vertica 的 COPY 是原子的吗?

看起来很简单,但我似乎无法在COPY.

Vertica 是COPY原子的吗?如果数据加载中断或以某种方式失败,Vertica 是否会负责清理工作?

vertica copy

4
推荐指数
1
解决办法
256
查看次数

为什么 C-Store 中的 Tuple Mover 只考虑比 LWM 早的行?

在 Michael Stonebraker 的 C-Store 论文(链接:http : //db.csail.mit.edu/projects/cstore/vldb.pdf)的 Tuple Mover 部分中,描述了以下内容:

MOP(合并出过程)将查找所选 WS 段中的所有记录,其插入时间在 LWM 或之前(低水位标记;时间戳顺序/纪元值)[...] 中记录的最近插入时间RS' 成为该段的新 t_lastmove 并且始终小于或等于 LWM。[...] 因此,LWM“追逐”HWM(高水位线),并选择它们之间的增量来在需要历史访问权限的用户需求和 WS 空间限制之间进行调解。

我不明白,当将记录从 WS(写优化存储)移动到 RS(读优化存储)时,为什么元组移动器只考虑比 LWM 早的记录?这不是意味着在 LWM 之后插入系统的所有行都只会在 WS 中吗?在 LWM 较小的系统中,即在支持旧历史查询的系统中,这可能意味着大部分记录将仅在 WS 中,我们将错过读取优化存储提供的所有优化。

我错过了什么吗?

columnstore vertica

3
推荐指数
1
解决办法
297
查看次数

如何构建分析型 BI 平台?

我正在为一家中型公司开发一个新的 BI 项目。目前还没有分析基础设施,报告是在 Excel 中手动完成的。有几个不同的数据源(来自不同的系统,如 Billing)需要集成来执行报告和分析。其中一些是数据转储,需要一些自定义转换才能进入数据库就绪形式。这些有大量的列。这些需要处理,所需的列过滤和聚合完成等。通常每天产生大约 50 GB 的数据,并且每天将插入到现有表中。

我们发现像 Vertica 这样的分析数据库值得研究。我们之前没有使用非 OLTP 数据库的任何经验。我的理解是 Vertica(和其他类似的)是读取优化的,非常适合分析任务。我的问题是在加载和处理原始数据的初始阶段如何公平?我们是否应该使用像 Oracle 这样的传统 OLTP 数据库,然后将 Vertica 用于星型模式、维度建模类型的数据存储?Vertica 是否适合 ETL 场景?

这种场景的典型架构如何?

data-warehouse database-design database-recommendation architecture vertica

1
推荐指数
1
解决办法
767
查看次数