PostgreSQL 上的机器学习

aid*_*ald 6 postgresql optimization machine-learning sparse-matrix bigdata

我感兴趣的描述运行的机器学习算法直接在PostgreSQL内部的位置

该论文的基本要点是我将我的算法编写为一个函数,该函数给出了第 n 个模型

def get_model(n):
   return make_step(model(n-1))

def make_step(model):
   # Compute gradient and make update and return new model
Run Code Online (Sandbox Code Playgroud)

这个想法是数据库将优化数据流,以便查询运行得非常快。

我的数据大约有 10^12 个样本,10^9 个特征,平均每个样本有 1000 个不为零的特征(高度!稀疏)。

我证明我的问题是合理的,因为我发现了以下内容,

我的问题是,

  • PostgreSQL 处理稀疏矩阵向量乘积的能力如何?
  • PostgreSQL 真的会针对更好的数据流和处理进行优化吗?
  • 我的任何假设或其他目标是否不切实际?