小编sup*_*pyo的帖子

A,20
B,10
C,40
D,5

data = LOAD 'myData.txt' USING PigStorage(',') AS key, value;
all = GROUP data ALL;
maxKey = FOREACH all GENERATE MAX(data.value);
DUMP maxKey;

Run Code Online (Sandbox Code Playgroud)

这返回40,但我想要完整的键值对:C,40.有任何想法吗？

hadoop apache-pig

sup*_*pyo

2016 12-24

6
推荐指数

1
解决办法

5561
查看次数

使用D3.js的极坐标图

有没有人知道使用D3 Javascript库生成极坐标图的好例子？

我见过一些玫瑰地块喜欢这个和这个,但我真的寻找的东西更类似于Matlab的极坐标图:

Matlab Polar Plot

任何例子都将非常感谢.谢谢!

javascript matlab d3.js

sup*_*pyo

lucky-day

6
推荐指数

1
解决办法

6008
查看次数

在 SQL 中实现不相交集逼近（并集查找）

使用 SQL 实现近似不相交集的最佳方法是什么？

细节

我有一个边表，存储为[vertex_a, vertex_b].

我需要一个不同集合的表，存储为[vertex, set_id]每个顶点一行，并用不相交的 set_id 标记每个顶点。

约束条件

必须是纯 SQL 实现。它可以利用 Postgres 特定的函数，但高度首选纯 ANSI SQL。
结果可以是近似的——当几个集合实际连接时将它们标记为不相交是可以接受的。如果可以调整近似边界，例如通过增加迭代次数，那就更好了。
库已经退出（没有 Boost、Numpy、Scipy）。必须是SQL。
大多数集合将包含 1 到 3 个顶点。很少有大集合，预计最多为 10 个顶点。

有关的

相关主题：在 C++ 中实现不相交集（并集查找）
这将是不相交集（并集查找）的近似实现- 维基百科

sql postgresql graph-theory

sup*_*pyo

2017 05-23

6
推荐指数

1
解决办法

2547
查看次数

用于矢量化数值计算的最佳Scala集合类型

寻找IndexedSeq[Double]在设计特定于域的数值计算库时使用的正确数据类型(例如).对于这个问题,我将范围限制在使用1维数组Double.该库将定义通常应用于1D阵列中每个元素的数字函数.

注意事项:

首选不可变数据类型,例如Vector或IndexedSeq
希望最大限度地减少数据转换
在空间和时间上合理有效
对使用该库的其他人友好
优雅而干净的API

我应该在集合层次结构中使用更高的东西,例如Seq？

或者仅仅定义单元素函数并将映射/迭代留给最终用户更好？

这似乎效率较低(因为一些计算可以在每组调用中完成一次),但同时也是一个更灵活的API,因为它适用于任何类型的集合.

有什么建议？

api scala numerical-computing scala-collections

sup*_*pyo

2012 12-06

5
推荐指数

1
解决办法

467
查看次数

使用多个返回值Vectorize Scala函数

向量化返回多个值的scala函数的最优雅方法是什么？

例如,假设我有这个功能:

def Foobar(foo: Int, bar: Int): (Int, Int) = (foo, bar)

Run Code Online (Sandbox Code Playgroud)

如果它返回一个值,我会做这样的事情:

val a = Array(1, 2, 3)
val b = Array(4, 5, 6)
val c = (a,b).zipped.map(foobar)

Run Code Online (Sandbox Code Playgroud)

但由于它返回一个元组,我最终得到了一个Array[(Int,Int)],而我更喜欢一个(Array[Int], Array[Int]).做这样的事情的正确方法是什么？是否有任何聪明的模式可以将此概括为:

val c = vectorized(foobar,a,b)

Run Code Online (Sandbox Code Playgroud)

任何想法将不胜感激.谢谢!

scala

sup*_*pyo

2012 12-05

3
推荐指数

1
解决办法

1414
查看次数

标签统计

d3.js ×2

javascript ×2

matlab ×2

scala ×2

apache-pig ×1

api ×1

git ×1

graph-theory ×1

hadoop ×1

ivy ×1

java ×1

maven ×1

numerical-computing ×1

postgresql ×1

repository ×1

sbt ×1

scala-collections ×1

sql ×1

swing ×1

testing ×1

web ×1

标签 统计

小编sup_pyo的帖子

标签统计