标签: data-cube

选择每组前 X 个结果

我有一堆带有附加属性的 RDF 数据立方体观察,在我的例子中是记录该值的日期。

例如,该模式很简单(省略其他维度/度量/属性):

<obs1> a qb:Observation ;
  my:lastupdate '2017-12-31'^^xsd:date ;
  qb:dataSet <dataSet1> .

<obs2> a qb:Observation ;
  my:lastupdate '2016-12-31'^^xsd:date ;
  qb:dataSet <dataSet1> .

<obs2_1> a qb:Observation ;
  my:lastupdate '2017-12-31'^^xsd:date ;
  qb:dataSet <dataSet2> .

<obs2_2> a qb:Observation ;
  my:lastupdate '2015-12-31'^^xsd:date ;
  qb:dataSet <dataSet2> .
Run Code Online (Sandbox Code Playgroud)

qb:DataSet所以我的店里有很多。现在我想找出my:lastupdate每个数据集的最后 X 值。假设我想要每个特定数据集的最后 5 个值。

对于一个特定的数据集,我可以非常轻松地做到这一点:

SELECT * WHERE {

  ?observation my:lastupdate ?datenstand ;
                 qb:dataSet <dataSet1>                                                                                                                                            
} ORDER BY DESC(?datenstand) LIMIT 5    
Run Code Online (Sandbox Code Playgroud)

但如果这在每个数据集的单个 SPARQL 查询中完全可能的话,我有点迷失了。我尝试了与子选择、LIMIT 和 GROUP BY 组合的各种组合,但没有任何结果导致我正在寻找的结果。

grouping sparql limit data-cube

3
推荐指数
1
解决办法
636
查看次数

优化嵌套循环操作

我有这个数据立方体包含图像的每个像素的数据(非常像高光谱成像).我试图以有效的方式在图像的每个像素上插入一条线.现在,我这样做:

我的datacube是一个6X1024x1024 numpy数组,我有另一个变量包含我的数据的自变量.

map = np.zeros((1024,1024))
for i in np.mgrid[1:1024]:
    for j in np.mgrid[1:1024]:
        x = independent_variable # This is my independent variable
        y = spec_cube[:,i,j] # The Y data to be fitted is the power at each scale, for a pixel
        index = polyfit(x,y,1) # Outputs the slope and the offset
        map[i,j] = index[0] # The pixel value is the index
Run Code Online (Sandbox Code Playgroud)

我知道嵌套for循环通常是最糟糕的事情,但我想不出更好的方法.

我尝试了以下但它给出了这个错误:"ValueError:解压缩的值太多了"

map = np.zeros((1024,1024))
for i,j in map:
    x = independent_variable # This is my independent variable …
Run Code Online (Sandbox Code Playgroud)

python numpy nested-loops data-cube

2
推荐指数
1
解决办法
3313
查看次数

标签 统计

data-cube ×2

grouping ×1

limit ×1

nested-loops ×1

numpy ×1

python ×1

sparql ×1