NumPy vectorize()或dot()出现错误

vis*_*tor 2 types numpy vectorization

在下面的代码中,y1和y2应该相等,但它们不是.vectorize()或dot()中可能有错误吗?

import numpy as np
interval = np.arange(0, 30, 0.1)
y1 = [- 1.57 * max(0, x - 10) - 0.72 * max(0, 15 - x)
      - 1.09 * max(0, 20 - x) for x in interval]

def fun(x, pivot, truth):
    if truth: return max(0, x - pivot)
    else:     return max(0, pivot - x)

pivots = [10, 15, 20]
truths = [ 1,  0,  0]
coeffs = [-1.57, -0.72, -1.09]
y2 = [np.dot(np.vectorize(fun)(x, pivots, truths), coeffs) for x in interval]

import matplotlib.pyplot as plt
plt.plot(interval, y1, interval, y2)
plt.show()
Run Code Online (Sandbox Code Playgroud)

y1和y2的图表: 绘制结果

hpa*_*ulj 5

我不确定这适用于你的情况,但vectorize有一些技巧.

如果您没有指定退货dtype,则会通过测试计算确定退货- 使用您的第一个案例.如果函数返回标量整数,如0,则vectorize返回整数数组.因此,如果您期望浮动,请确保指定返回dtype.

此外 - vectorize不是速度工具.这只是将广播应用于输入的便捷方式.它并不比显式循环输入快得多.

np.vectorize(fun, otypes=[float])
Run Code Online (Sandbox Code Playgroud)

删除步骤.

===========

试试这个:

vfun = np.vectorize(fun, otypes=[float])
X = vfun(interval[:,None], pivots, truths)
print(X.shape)     # (300,3)
y2 = np.dot(X, coeffs)
print(y2.shape)    # (300,)
Run Code Online (Sandbox Code Playgroud)

它更充分地利用了vectorize's广播.

我怀疑你的fun写作是为了整体行事x,没有迭代vectorize.

更改fun为使用np.maximum,允许我提供一个数组x:

def fun(x, pivot, truth):
    if truth: return np.maximum(0, x - pivot)
    else:     return np.maximum(0, pivot - x)
Run Code Online (Sandbox Code Playgroud)

然后我可以X在3个案例中仅使用循环计算,pivots并一次truths计算所有interval值:

X = np.stack([fun(interval, p, t) for p, t in zip(pivots, truths)], axis=-1)
y2 = np.dot(X, coeffs)
Run Code Online (Sandbox Code Playgroud)

应用3'案例的另一种方式

Xlist = [fun(interval, p, t)*c for p, t, c in zip(pivots, truths, coeffs)]
y2 = np.sum(Xlist, axis=0)
Run Code Online (Sandbox Code Playgroud)

因为np.dot(..., coeffs)它只是一个加权和.我不确定它会更好.