小编Diy*_*fly的帖子

使用 python 句子的 word2vec 查找 2 个句子之间的相似度

我想使用 word2vectors 计算两个句子之间的相似度,我试图获取一个句子的向量,以便我可以计算句子向量的平均值以找到余弦相似度。我已经尝试过这段代码,但它不起作用。它的输出给出带有 1 的句子向量。我想要句子_1_avg_向量和句子_2_avg_向量中句子的实际向量。

代码:

    #DataSet#
    sent1=[['What', 'step', 'step', 'guide', 'invest', 'share', 'market', 'india'],['What', 'story', 'Kohinoor', 'KohiNoor', 'Diamond']]
    sent2=[['What', 'step', 'step', 'guide', 'invest', 'share', 'market'],['What', 'would', 'happen', 'Indian', 'government', 'stole', 'Kohinoor', 'KohiNoor', 'diamond', 'back']]
    sentences=sent1+sent2

    #''''Applying Word2vec''''#
    word2vec_model=gensim.models.Word2Vec(sentences, size=100, min_count=5)
    bin_file="vecmodel.csv"
    word2vec_model.wv.save_word2vec_format(bin_file,binary=False)

    #''''Making Sentence Vectors''''#
    def avg_feature_vector(words, model, num_features, index2word_set):
        #function to average all words vectors in a given paragraph
        featureVec = np.ones((num_features,), dtype="float32")
        #print(featureVec)
        nwords = 0
        #list containing names of words in the vocabulary
        index2word_set = set(model.wv.index2word)# …
Run Code Online (Sandbox Code Playgroud)

python nlp

4
推荐指数
1
解决办法
4860
查看次数

如何使用python在CSV文件中插入两列?

我想在新的 csv 文件中插入两列。问题 1 数据应在第一列中,问题 2 数据应在第二列中

下面给出的代码给了我这个输出:

['question1']
['a','b','c','d']
['e','f','g']
['h','i','j','k','l']
['question2']
['a','b','c','d','x','y']
['e','f','g','m','n','o','p','q']
['h','i','j','k','l','r','s',]
Run Code Online (Sandbox Code Playgroud)

这是我的代码:

col1=question1.split("\n")
col2=question2.split("\n")
with open("outputFile.csv" , mode="wt", encoding='UTF-8') as out_file:
     w=csv.writer(out_file)
     for row in col1:
         myColumns = row.split("\n")
         print(myColumns)
         w.writerow(myColumns)
     for row in col2:
         myColumns = row.split("\n")
         print(myColumns)
         w.writerow(myColumns)
Run Code Online (Sandbox Code Playgroud)

输出应该是这样的:问题 1 应该在 csv 的第一列中,问题 2 应该在 csv 文件的第二列中

['question1']   ['question2']
['a','b','c','d']  ['a','b','c','d','x','y']
['e','f','g']  ['e','f','g','m','n','o','p','q']
['h','i','j','k','l']  ['h','i','j','k','l','r','s',]
Run Code Online (Sandbox Code Playgroud)

请帮助我如何解决问题..

python csv

1
推荐指数
1
解决办法
880
查看次数

标签 统计

python ×2

csv ×1

nlp ×1