小编xdu*_*ch0的帖子

在QA系统中训练具有不同长度句子的神经网络

我试图实现以下的说明显示对这样的质量保证体系文件.我已经正确导入了一些数据集,并使用word2vec方法转换了向量中的单词.在嵌入一词之后,需要在CNN中插入问题和答案.考虑到每个问题/答案的长度不同,输入Tensor的大小应该是多少?(每个问题/答案都是一组向量).

论文摘录:

在此输入图像描述

q_emb是单词嵌入后的问题,r_w_k是长度为d的单词向量.

哪个是应该使用的M(Q/A的长度)的正确值?你能告诉我一些方法来解决这个问题或者只是给我一些帮助吗?谢谢

neural-network nlp-question-answering word2vec

5
推荐指数
1
解决办法
147
查看次数

计算 rmse 时 Pytorch 掩码缺失值

我正在尝试计算两个火炬张量的均方根误差。我想忽略/屏蔽标签为 0(缺失值)的行。我如何修改这一行以考虑该限制?

torch.sqrt(((preds.detach() - labels) ** 2).mean()).item()
Run Code Online (Sandbox Code Playgroud)

先感谢您。

pytorch

4
推荐指数
1
解决办法
1974
查看次数

numpy.tensordot 函数是如何逐步工作的?

我是 numpy 的新手,所以我在可视化numpy.tensordot()函数的工作时遇到了一些问题。根据 的文档tensordot,轴在参数中传递,其中轴 = 0 或 1 表示正常矩阵乘法,而轴 = 2 表示收缩。

有人可以解释一下乘法将如何处理给定的例子吗?

示例 1:a=[1,1] b=[2,2] for axes=0,1为什么它会在轴 = 2 时引发错误?
示例 2:a=[[1,1],[1,1]] b=[[2,2],[2,2]] for axes=0,1,2

python numpy

3
推荐指数
1
解决办法
2904
查看次数