因此,我有一个包含1366 个样本的嵌套列表,每个样本有2 个特征和不同的序列长度,这些序列长度应该是 LSTM 的输入数据。标签应该是每个序列的一对值,即[-0.76797587, 0.0713816]。本质上,数据如下所示:
X = [[[-0.11675862, -0.5416186], [-0.76797587, 0.0713816]], [[-0.5115555, 0.25823522], [0.6099151999999999, 0.21718016], [-0.0022403747, 0.6470206999999999]]]
Run Code Online (Sandbox Code Playgroud)
我想做的是将这个列表转换为输入张量。据我了解,LSTM 接受不同长度的序列,因此在本例中,第一个样本的长度为 2,第二个样本的长度为 3。
目前我正在尝试通过以下方式转换列表:
train_data = TensorDataset(torch.tensor(X, dtype=torch.float32), torch.tensor(Y, dtype=torch.float32))
train_dataloader = DataLoader(train_data, batch_size=batch_size, shuffle=True)
Run Code Online (Sandbox Code Playgroud)
虽然这会产生以下错误ValueError: expected sequence of length 5 at dim 1 (got 3)
我猜这是因为第一个序列的长度为 5,第二个序列的长度为 3,这是不可转换的?
如何将给定列表转换为张量?或者我对训练 LSTM 的方式思考错误?
谢谢你的帮助!