相关疑难解决方法(0)

如何在Python中实现Softmax函数

从Udacity的深度学习类中,y_i的softmax只是指数除以整个Y向量的指数之和:

哪里S(y_i)是的SOFTMAX功能y_i,并e为指数和j是否定的.输入向量Y中的列数.

我尝试过以下方法:

import numpy as np

def softmax(x):
    """Compute softmax values for each sets of scores in x."""
    e_x = np.exp(x - np.max(x))
    return e_x / e_x.sum()

scores = [3.0, 1.0, 0.2]
print(softmax(scores))

Run Code Online (Sandbox Code Playgroud)

[ 0.8360188   0.11314284  0.05083836]

Run Code Online (Sandbox Code Playgroud)

但建议的解决方案是:

def softmax(x):
    """Compute softmax values for each sets of scores in x."""
    return np.exp(x) / np.sum(np.exp(x), axis=0)

Run Code Online (Sandbox Code Playgroud)

它产生与第一个实现相同的输出,即使第一个实现显式获取每列和最大值的差异,然后除以总和.

有人可以用数学方式显示原因吗？一个是正确的而另一个是错的吗？

实现在代码和时间复杂性方面是否相似？哪个更有效率？

python numpy machine-learning logistic-regression softmax

alv*_*vas

2017 12-11

219
推荐指数

10
解决办法

19万
查看次数

Python/Scikit Lear - 无法处理多类和连续的混合

我正在尝试将SGDRegressor放入我的数据中,然后检查准确性.拟合工作正常,但是预测与原始目标数据的数据类型(？)不同,我得到了错误

ValueError: Can't handle mix of multiclass and continuous

Run Code Online (Sandbox Code Playgroud)

当调用print "Accuracy:", ms.accuracy_score(y_test,predictions).

数据看起来像这样(只有20万+行):

Product_id/Date/product_group1/Price/Net price/Purchase price/Hour/Quantity/product_group2
0   107 12/31/2012  10  300 236 220 10  1   108

Run Code Online (Sandbox Code Playgroud)

代码如下:

from sklearn.preprocessing import StandardScaler
import numpy as np
from sklearn.linear_model import SGDRegressor
import numpy as np
from sklearn import metrics as ms

msk = np.random.rand(len(beers)) < 0.8

train = beers[msk]
test = beers[~msk]

X = train [['Price', 'Net price', 'Purchase price','Hour','Product_id','product_group2']]
y = train[['Quantity']]
y = y.as_matrix().ravel()

X_test = test [['Price', …

Run Code Online (Sandbox Code Playgroud)

python scikit-learn

lte*_*e__

2019 04-14

17
推荐指数

2
解决办法

4万
查看次数

当损耗是均方误差(MSE)时,什么函数定义了Keras的准确度？

当损失函数是均方误差时,如何定义准确度？是绝对百分比误差吗？

我使用的模型具有输出激活线性和编译 loss= mean_squared_error

model.add(Dense(1))
model.add(Activation('linear'))  # number

model.compile(loss='mean_squared_error', optimizer='adam', metrics=['accuracy'])

Run Code Online (Sandbox Code Playgroud)

输出看起来像这样:

Epoch 99/100
1000/1000 [==============================] - 687s 687ms/step - loss: 0.0463 - acc: 0.9689 - val_loss: 3.7303 - val_acc: 0.3250
Epoch 100/100
1000/1000 [==============================] - 688s 688ms/step - loss: 0.0424 - acc: 0.9740 - val_loss: 3.4221 - val_acc: 0.3701

Run Code Online (Sandbox Code Playgroud)

那么例如val_acc:0.3250是什么意思？Mean_squared_error应该是标量而不是百分比 - 不应该吗？那么val_acc - 均方误差,或平均百分比误差或其他函数？

根据维基百科上的MSE定义:https://en.wikipedia.org/wiki/Mean_squared_error

MSE是估计量质量的度量 - 它总是非负的,接近零的值更好.

这是否意味着价值val_acc: 0.0优于val_acc: 0.325？

编辑:我训练时精确度量输出的更多示例 - 随着我训练更多,精度会增加.虽然损失函数 - mse应该减少.是否为mse定义了准确度 - 它是如何在Keras中定义的？

lAllocator: After …

Run Code Online (Sandbox Code Playgroud)

regression machine-learning mean-square-error keras loss-function

End*_*oen

2019 01-31

15
推荐指数

2
解决办法

8738
查看次数

分类指标不能同时处理二进制目标和连续目标

我正在学习SciKit-Learn，我想确定最适合我的数据的模型。如下面的代码所示，我尝试训练和测试多个模型，并尝试打印出精度。这些模型中只有某些模型可以工作，其他模型则因ValueError失败：分类指标无法处理二进制目标和连续目标的混合情况。

这个错误是什么意思？如何修改下面的代码以成功评估失败的模型？

import pandas as pd
import numpy as np

import matplotlib.pyplot as plt
from sklearn import model_selection
from sklearn.metrics import classification_report
from sklearn.metrics import confusion_matrix
from sklearn.metrics import accuracy_score

from sklearn import linear_model
from sklearn import svm

from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis
from sklearn.naive_bayes import GaussianNB
from sklearn.svm import SVC

from sklearn import preprocessing
from sklearn import utils

# Shuffle pandas rows randomly
from sklearn.utils import shuffle

# …

Run Code Online (Sandbox Code Playgroud)

python machine-learning python-3.x scikit-learn

Phi*_*Bot

2019 10-12

5
推荐指数

1
解决办法

3473
查看次数