我想在python中使用tensorflow创建一个聊天机器人.但是当我训练数据集时,我收到了这个错误.
提高ValueError(err.message)ValueError:Shape必须为rank 2,但对于'model_with_buckets/sequence_ loss/sequence_loss_by_example/sampled_softmax_loss/LogUniformCandidateSampler'(op:'LogUniformCandidateSampler'),其输入形状为[?].
任何帮助赞赏.谢谢
我的GPU模型是NVIDIA GeForce GT 635M,在NVIDIA网站上,据说该GPU支持CUDA。我可以在此GPU中使用TensorFlow或PyTorch或任何其他种类的深度学习平台吗?
我必须每天对包含600万行和20多列的数据集运行回归.我想加快计算速度并将其移入云端.是tensorflow.rstudio目前我的目的是最好的选择?
我有以下输入数据结构:
X1 | X2 | X3 | ... | Output (Label)
118.12341 | 118.12300 | 118.12001 | ... | [a value between 0 & 1] e.g. 0.423645
Run Code Online (Sandbox Code Playgroud)
我使用它tensorflow来解决预测Output变量未来值的回归问题。为此,我构建了一个前馈神经网络,该网络具有三个具有relu激活函数的隐藏层和一个具有一个节点的最终输出层linear activation。该网络使用优化器通过反向传播进行训练adam。
我的问题是,在对网络进行了数千次训练后,我意识到输入特征和输出中的这种高度小数的值仅导致预测接近小数点后第二位,例如:
Real value = 0.456751 | Predicted value = 0.452364
Run Code Online (Sandbox Code Playgroud)
然而,这不被接受,我需要精确到小数点后第四位(至少)才能接受该值。
问:是否有任何值得信赖的技术可以正确解决这个问题以获得更好的结果(也许是转换算法)?
提前致谢。
machine-learning data-analysis neural-network keras tensorflow
我想用 graphcore IPU 测试性能,但我不知道如何使用 tensorflow。有人可以帮我做到这一点吗?
我正面临一个实时问题,它有 4 个特征:
Vmean, Vmedian, Vnow, VV。我想要做的是:
for i in range(len(X)):
model.fit(X[i], X[i+1])
model.predict(X[i+1])
Run Code Online (Sandbox Code Playgroud)
也就是说,我试图预测X[i+2]throughX[i+1]和的值X[i],因为一行与下一行相关,依此类推。这是我的模型:
def kerasModel():
input_layer = keras.layers.Input(shape=(4, 1), name='input_shape')
x = keras.layers.LSTM(100, name='lstm_0')(input_layer)
x = keras.layers.Dropout(0.2, name='lstm_dropout')(x)
x = keras.layers.Dense(64, name='x2')(x)
output = keras.layers.Dense(4, activation='linear', name='x3')(x)
model = keras.Model(inputs=input_layer, outputs=output)
adam = keras.optimizers.Nadam(lr=0.005)
model.compile(optimizer=adam, loss='mse')
return model
Run Code Online (Sandbox Code Playgroud)
但它不起作用。它没有像它应该做的那样预测下一个值。我的问题是:是否有任何论文或规则可以根据您的特征制作一个好的深度学习模型?另外,基于这个问题,哪个可能是一个好的模型?
假设我们将模型保存为 h5,那么我们可以使用 keras 的 load_model 函数加载模型。我浏览了多个 github 链接,其中作者提供了权重文件(.h5 或 .hdf5 文件)。
那么我们可以使用 load_model 来使用那些预训练的权重/模型吗?
load_model 和 load_weights 之间有什么区别?
我可以使用 load_model (keras) 加载权重文件还是应该使用 (load_weight)。如果我们正在加载重量,那么我们还必须加载模型的整个架构。
请通过举一些例子来提供更深入的理解。
我正在学习以下课程: https://classroom.udacity.com/courses/ud730/lessons/6452084188/concepts/65798813760923 我已经设置了 docker 并安装了 TenorFlow 我已经创建了一个容器并在提交时下载了 notMnist 图像,docker花费了很多时间并且没有提交请解决编辑:请注意它正在运行几个小时。
tensorflow ×8
python ×5
keras ×3
gpu ×2
amazon-ec2 ×1
docker ×1
ipu ×1
pytorch ×1
r ×1
regression ×1