我试图实现以下的说明显示对这样的质量保证体系文件.我已经正确导入了一些数据集,并使用word2vec方法转换了向量中的单词.在嵌入一词之后,需要在CNN中插入问题和答案.考虑到每个问题/答案的长度不同,输入Tensor的大小应该是多少?(每个问题/答案都是一组向量).
论文摘录:
q_emb是单词嵌入后的问题,r_w_k是长度为d的单词向量.
哪个是应该使用的M(Q/A的长度)的正确值?你能告诉我一些方法来解决这个问题或者只是给我一些帮助吗?谢谢
我正在尝试计算两个火炬张量的均方根误差。我想忽略/屏蔽标签为 0(缺失值)的行。我如何修改这一行以考虑该限制?
torch.sqrt(((preds.detach() - labels) ** 2).mean()).item()
Run Code Online (Sandbox Code Playgroud)
先感谢您。
我是 numpy 的新手,所以我在可视化numpy.tensordot()函数的工作时遇到了一些问题。根据 的文档tensordot,轴在参数中传递,其中轴 = 0 或 1 表示正常矩阵乘法,而轴 = 2 表示收缩。
有人可以解释一下乘法将如何处理给定的例子吗?
示例 1:
a=[1,1] b=[2,2] for axes=0,1为什么它会在轴 = 2 时引发错误?
示例 2:a=[[1,1],[1,1]] b=[[2,2],[2,2]] for axes=0,1,2