在QA系统中训练具有不同长度句子的神经网络

Luc*_*llo 5 neural-network nlp-question-answering word2vec

我试图实现以下的说明显示对这样的质量保证体系文件.我已经正确导入了一些数据集,并使用word2vec方法转换了向量中的单词.在嵌入一词之后,需要在CNN中插入问题和答案.考虑到每个问题/答案的长度不同,输入Tensor的大小应该是多少?(每个问题/答案都是一组向量).

论文摘录:

在此输入图像描述

q_emb是单词嵌入后的问题,r_w_k是长度为d的单词向量.

哪个是应该使用的M(Q/A的长度)的正确值?你能告诉我一些方法来解决这个问题或者只是给我一些帮助吗?谢谢

小智 3

确定最大问题/答案向量数组长度并使输入张量的形状为(num_samples, max_qa_length, word_embedding_size)。对于短于 的问题max_qa_length,请在末尾用零向量填充它们。