Pytorch：尝试将转换应用于 numpy 数组...失败并出现错误

Question

Pytorch：尝试将转换应用于 numpy 数组...失败并出现错误

任何帮助都感激不尽。transforms.py 中的代码表示转换应该/将适用于 PIL 图像以及 ndarrays。鉴于变换：

data_transforms = {
    'train': transforms.Compose([
        transforms.Scale(256),
        transforms.Pad(4,0),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
    'val': transforms.Compose([
        transforms.Scale(256),
        transforms.Pad(4,0),
        transforms.ToTensor(),
        transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
    ]),
}

Run Code Online (Sandbox Code Playgroud)

我希望对从其他代码获得的 ndarray 应用转换。假设它是 x_data，其形状为 (1000,120,160,3)，其中尺寸为（总行数、宽度、高度、通道）

执行以下操作失败（我要做的就是应用转换）：

foo = data_transforms['train']
bar = foo(x_data[0])

Run Code Online (Sandbox Code Playgroud)

带有以下消息：

---------------------------------------------------------------------------
TypeError                                 Traceback (most recent call last)
<ipython-input-93-a703e3b9c76d> in <module>()
----> 1 foo(x_data[1])

~/anaconda3/envs/pytorch/lib/python3.5/site-packages/torchvision-0.1.9-py3.5.egg/torchvision/transforms.py in __call__(self, img)
     32     def __call__(self, img):
     33         for t in self.transforms:
---> 34             img = t(img)
     35         return img
     36 

~/anaconda3/envs/pytorch/lib/python3.5/site-packages/torchvision-0.1.9-py3.5.egg/torchvision/transforms.py in __call__(self, img)
    185         """
    186         if isinstance(self.size, int):
--> 187             w, h = img.size
    188             if (w <= h and w == self.size) or (h <= w and h == self.size):
    189                 return img

TypeError: 'int' object is not iterable

Run Code Online (Sandbox Code Playgroud)

Answer 1

小智 6

大多数转换方法仅将 PIL 对象作为输入。但是您可以添加另一个称为transforms.ToPILImage()nd-array 作为输入的转换，以将 nd-array 转换为 PIL 对象。所以在你的情况下，字典变量应该变成：

data_transforms = {
'train': transforms.Compose([
    transforms.ToPILImage()
    transforms.Scale(256),
    transforms.Pad(4,0),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
]),
'val': transforms.Compose([
    transforms.Scale(256),
    transforms.Pad(4,0),
    transforms.ToTensor(),
    transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
]),
}

Run Code Online (Sandbox Code Playgroud)

请注意，这些转换是按顺序进行的。因此，您有必要将toPILImage转换添加为第一个转换。因此，您的 nd-array 首先转换为 PIL 对象，然后应用其他转换。

Answer 2

小智 0

我认为你不能对 numpy 数组应用转换。缩放（现在的调整大小）在 PIL 图像上的工作方式与许多其他转换类似。

源代码非常容易理解，请看这里：https ://github.com/pytorch/vision/blob/master/torchvision/transforms.py

归档时间：	8 年，4 月前
查看次数：	9202 次
最近记录：	7 年，8 月前