我的结构遵循熊猫数据帧:
n X Y Z
0 1.000000 1.000000 1.014925
1 1.000000 1.000000 1.000000
Run Code Online (Sandbox Code Playgroud)
我想从每列创建 M 个单独的子图(直方图)。一张直方图来自 X,一张来自 Y,最后一张来自 Z。
我希望它有不同的情节。我正在查看https://seaborn.pydata.org/generated/seaborn.FacetGrid.html,但我不明白如何从我的数据中绘制它的语法/逻辑。
该教程似乎没有解释我们应该如何加载、拆分和进行适当的增强。
让我们有一个由汽车和猫组成的数据集。文件夹结构为:
data
cat
0101.jpg
0201.jpg
...
dogs
0101.jpg
0201.jpg
...
Run Code Online (Sandbox Code Playgroud)
首先,我通过 datasets.ImageFolder 函数加载数据集。图像函数有命令“TRANSFORM”,我们可以在其中设置一些增强命令,但我们不想将增强应用于测试数据集!所以让我们继续使用transform=None。
data = datasets.ImageFolder(root='data')
Run Code Online (Sandbox Code Playgroud)
显然,我们没有文件夹结构训练和测试,因此我认为一个好的方法是使用split_dataset 函数
train_size = int(split * len(data))
test_size = len(data) - train_size
train_dataset, test_dataset = torch.utils.data.random_split(data, [train_size, test_size])
Run Code Online (Sandbox Code Playgroud)
现在让我们按以下方式加载数据。
train_loader = torch.utils.data.DataLoader(train_dataset,
batch_size=8,
shuffle=True)
test_loader = torch.utils.data.DataLoader(test_dataset,
batch_size=8,
shuffle=True)
Run Code Online (Sandbox Code Playgroud)
如何将转换(数据增强)应用于“train_loader”图像?
基本上我需要: 1. 从上面解释的文件夹结构加载数据 2. 将数据拆分为测试/训练部分 3. 在训练部分应用增强。