PyTorch Binary分类-相同的网络结构，“更简单”的数据，但性能较差？

Question

PyTorch Binary分类-相同的网络结构，“更简单”的数据，但性能较差？

Phi*_*ien 14 python artificial-intelligence machine-learning deep-learning pytorch

为了掌握PyTorch（以及一般的深度学习），我首先研究了一些基本的分类示例。其中一个示例是对使用sklearn创建的非线性数据集进行分类（完整代码可在此处作为笔记本查看）

n_pts = 500
X, y = datasets.make_circles(n_samples=n_pts, random_state=123, noise=0.1, factor=0.2)
x_data = torch.FloatTensor(X)
y_data = torch.FloatTensor(y.reshape(500, 1))

Run Code Online (Sandbox Code Playgroud)

然后使用相当基本的神经网络将其准确分类

class Model(nn.Module):
    def __init__(self, input_size, H1, output_size):
        super().__init__()
        self.linear = nn.Linear(input_size, H1)
        self.linear2 = nn.Linear(H1, output_size)

    def forward(self, x):
        x = torch.sigmoid(self.linear(x))
        x = torch.sigmoid(self.linear2(x))
        return x

    def predict(self, x):
        pred = self.forward(x)
        if pred >= 0.5:
            return 1
        else:
            return 0

Run Code Online (Sandbox Code Playgroud)

当我对健康数据感兴趣时，我决定尝试使用相同的网络结构对一些基本的现实世界数据集进行分类。我从这里获取了一名患者的心率数据，并对其进行了更改，以便所有> 91的值都被标记为异常（例如a 1，所有<= 91的值都标记为a 0）。这是完全任意的，但是我只是想看看分类是如何工作的。此示例的完整笔记本在这里。

对我来说不直观的是，为什么第一个示例在1,000个历元后损失0.0016，而第二个示例在10,000个历元后却损失0.4296

也许我天真地认为心率示例更容易分类。任何能帮助我理解为什么这不是我所看到的见解都会很棒！

Answer 1

Sha*_*hai 14

TL; DR

您的输入数据未标准化。

使用 x_data = (x_data - x_data.mean()) / x_data.std()
提高学习率 optimizer = torch.optim.Adam(model.parameters(), lr=0.01)

你会得到

仅1000次迭代即可收敛。

如果我无法规范化数据怎么办？

如果由于某种原因您无法预先计算均值和标准数据，则仍可以nn.BatchNorm1d在训练过程中使用它来估计和标准化数据。例如

class Model(nn.Module):
    def __init__(self, input_size, H1, output_size):
        super().__init__()
        self.bn = nn.BatchNorm1d(input_size)  # adding batchnorm
        self.linear = nn.Linear(input_size, H1)
        self.linear2 = nn.Linear(H1, output_size)

    def forward(self, x):
        x = torch.sigmoid(self.linear(self.bn(x)))  # batchnorm the input x
        x = torch.sigmoid(self.linear2(x))
        return x

Run Code Online (Sandbox Code Playgroud)

这种修改不会对输入数据进行任何更改，仅在1000个纪元后就会产生类似的收敛：

轻微评论

为了数值稳定，最好使用nn.BCEWithLogitsLoss代替nn.BCELoss。为此，您需要torch.sigmoid从forward()输出中删除，sigmoid它将在损失内计算。
见，例如，这个线程，关于相关乙状结肠+交叉熵二进制预测的损失。

归档时间：	6 年，4 月前
查看次数：	350 次
最近记录：	6 年，3 月前

PyTorch Binary分类-相同的网络结构，“更简单”的数据，但性能较差？

TL; DR

更多细节

如果我无法规范化数据怎么办？

轻微评论