标签: vertica

如何获取 Vertica 数据库的大小？

我有一个 Vertica 数据库。我怎么知道数据库有多大？

我需要一个粗略的答案，以便向高层管理人员报告有关我们环境的基本统计数据。

database-size vertica

Nic*_*mas

lucky-day

7
推荐指数

1
解决办法

2万
查看次数

成对交叉点

我有一个包含两列的表，比如说名字和姓氏。我需要另一个表，其中对于第一对中的每一对名字，都包含共同姓氏的计数。

这在 SQL 中可行吗？

如果姓氏的唯一性会影响查询的效率，则姓氏的唯一性比名字的唯一性要多得多。

一个玩具示例，输入：

FirstName, LastName
John, Smith
John, Doe
Jane, Doe

Run Code Online (Sandbox Code Playgroud)

输出：

FirstName1, FirstName2, CommonLastNames
John, John, 2
John, Jane, 1
Jane, Jane, 1
Jane, John, 1

Run Code Online (Sandbox Code Playgroud)

由于这种关系是自反且对称的，因此如果结果只是三角形之一（例如，对角线上方的三角形）也没关系。

vertica

And*_*nis

2015 06-14

4
推荐指数

1
解决办法

986
查看次数

Vertica 的 COPY 是原子的吗？

看起来很简单，但我似乎无法在COPY.

Vertica 是COPY原子的吗？如果数据加载中断或以某种方式失败，Vertica 是否会负责清理工作？

vertica copy

Nic*_*mas

lucky-day

4
推荐指数

1
解决办法

256
查看次数

为什么 C-Store 中的 Tuple Mover 只考虑比 LWM 早的行？

在 Michael Stonebraker 的 C-Store 论文（链接：http : //db.csail.mit.edu/projects/cstore/vldb.pdf）的 Tuple Mover 部分中，描述了以下内容：

MOP（合并出过程）将查找所选 WS 段中的所有记录，其插入时间在 LWM 或之前（低水位标记；时间戳顺序/纪元值）[...] 中记录的最近插入时间RS' 成为该段的新 t_lastmove 并且始终小于或等于 LWM。[...] 因此，LWM“追逐”HWM（高水位线），并选择它们之间的增量来在需要历史访问权限的用户需求和 WS 空间限制之间进行调解。

我不明白，当将记录从 WS（写优化存储）移动到 RS（读优化存储）时，为什么元组移动器只考虑比 LWM 早的记录？这不是意味着在 LWM 之后插入系统的所有行都只会在 WS 中吗？在 LWM 较小的系统中，即在支持旧历史查询的系统中，这可能意味着大部分记录将仅在 WS 中，我们将错过读取优化存储提供的所有优化。

我错过了什么吗？

columnstore vertica

Joy*_*tta

lucky-day

3
推荐指数

1
解决办法

297
查看次数

如何构建分析型 BI 平台？

我正在为一家中型公司开发一个新的 BI 项目。目前还没有分析基础设施，报告是在 Excel 中手动完成的。有几个不同的数据源（来自不同的系统，如 Billing）需要集成来执行报告和分析。其中一些是数据转储，需要一些自定义转换才能进入数据库就绪形式。这些有大量的列。这些需要处理，所需的列过滤和聚合完成等。通常每天产生大约 50 GB 的数据，并且每天将插入到现有表中。

我们发现像 Vertica 这样的分析数据库值得研究。我们之前没有使用非 OLTP 数据库的任何经验。我的理解是 Vertica（和其他类似的）是读取优化的，非常适合分析任务。我的问题是在加载和处理原始数据的初始阶段如何公平？我们是否应该使用像 Oracle 这样的传统 OLTP 数据库，然后将 Vertica 用于星型模式、维度建模类型的数据存储？Vertica 是否适合 ETL 场景？

这种场景的典型架构如何？

data-warehouse database-design database-recommendation architecture vertica

sfa*_*tor

2014 09-01

1
推荐指数

1
解决办法

767
查看次数