小编Raz*_*ici的帖子

太字节数据集

我有一种感觉,大多数数据库系统起源于 80 年代,并且刻板地实现了表、ACID 事务和约束。它们的构建考虑到了内存、磁盘和处理能力的稀缺性。

我想知道是否有任何存储系统(不需要通过 SQL 访问)能够处理以下内容:

  • 图(查询 la SPARQL)。
  • 矩阵(n 维)也稀疏。支持平凡矩阵算法,如 SVD、聚类。
  • 有效管理不会连续变化的大(TB 级)数据;通过每天的批次正在发生变化。
  • 使用大型磁盘系统(14TB 的 RAID5 现在不到 1500 美元)。这意味着有更多空间用于索引、预先计算的结果等。
  • 利用 GPU/多核/处理器/节点进行大型查询和索引。

我知道大多数项目都在某处实现(Apache Cassandra、SPARQL、Netezza、Exadata),但我不知道任何可能实现所有项目的产品。

performance graph

7
推荐指数
1
解决办法
778
查看次数

标签 统计

graph ×1

performance ×1