机器学习:为什么xW + b而不是Wx + b？

Question

我开始学习机器学习.现在我试着玩tensorflow.

我常常看到这样的例子:

pred = tf.add(tf.mul(X, W), b)

我也在一个简单的numpy实现中看到了这样一条线.为什么总是x*W+b用而不是W*x+b？如果矩阵以这种方式成倍增加是否有优势？我看到它是可能的(如果X,W并且b被转置),但我没有看到优势.在数学课上我们总是只使用Wx+b.

非常感谢你

Answer 1

这就是原因:

要正确地将两者相乘并在正确的特征中使用正确的权重,您必须使用X*w + b:

如果乘以w*X,则乘以(1 xd)*(nxd)并且没有任何意义.