小编Kri*_*ris的帖子

BigQuery:被错误消息吸引

我今天遇到了一个来自BigQuery的非常有趣的错误消息.我正在查询一个有一个名字的桌子user.yob(如出生年份).当我编写查询时,我有点草率,投射到不存在的字段"user.age"而不是user.yob:

SELECT user.age, ...
Run Code Online (Sandbox Code Playgroud)

这会生成以下错误消息:

BigQuery error in mk operation: Field 'user.age' not found; did you mean 'user.yob'?
Run Code Online (Sandbox Code Playgroud)

现在我很好奇..

BigQuery如何设法建议我实际想要投射的精确字段?

顺便说一句,我查询的表有很多字段(至少50左右),所以它不是user.yob唯一可用的字段.

google-bigquery

7
推荐指数
1
解决办法
305
查看次数

Vowpal Wabbit:低秩矩阵分解?

我有一个非常基本的问题.我想做低级矩阵分解,我正在查看有关该主题的Vowpal Wabbit文档.我的问题是:

这两种方法有区别吗?(实施或其他)

$ vw --lrq ab5
Run Code Online (Sandbox Code Playgroud)

要么

$ vw -q ab --rank 5
Run Code Online (Sandbox Code Playgroud)

在这里,ab有多项功能的命名空间和5为潜在因素维度.


可能的后续行动:

如果这些是等价的,--rank也适用于高阶交互?

machine-learning vowpalwabbit matrix-factorization

7
推荐指数
1
解决办法
720
查看次数

numpy:在两个2d数组的一个公共轴上进行广播乘法

我正在寻找一种以元素方式分别乘以形状(a,b)和(b,c)的两个2d数组的方法。在“ b”轴上,这是两个数组的共同点。

例如,我要广播(向量化)的示例是:

import numpy as np    

# some dummy data
A = np.empty((2, 3))
B = np.empty((3, 4))

# naive implementation
C = np.vstack(np.kron(A[:, i], B[i, :]) for i in [0, 1, 2])

# this should give (3, 2, 4)
C.shape
Run Code Online (Sandbox Code Playgroud)

有人知道在这里做什么吗?有没有更好的办法?

python arrays optimization numpy

6
推荐指数
1
解决办法
291
查看次数

Vowpal Wabbit:具体使用了什么哈希函数?

我真的很想知道哪个哈希函数用于 Vowpal Wabbit 中的特征哈希。

我知道底层算法是Murmurhash 3,但是我无法通过查看 github 上的 VW 代码来了解详细信息。

有谁知道 VW 中到底使用了哪个哈希函数?

hash vowpalwabbit

5
推荐指数
1
解决办法
895
查看次数

MySQL:GROUP BY 上的非聚合字段会发生什么?

我对 MySQL 中的以下行为有一个非常基本的问题。

假设我们执行以下操作GROUP BY

SELECT a, b, SUM(c)
FROM table
GROUP BY b;
Run Code Online (Sandbox Code Playgroud)

发生了什么领域a,这既不是聚集也不是包含在GROUP BY字段?

MySQL 是否只是隐式适用FIRST(a)a?如果是这样,这种行为是一致的还是从 的所有值中获取一个随机值a

mysql aggregate-functions

3
推荐指数
1
解决办法
1160
查看次数