小编zhf*_*fkt的帖子

如何使用gensim的word2vec模型和python计算句子相似度

根据Gensim Word2Vec,我可以使用gensim包中的word2vec模型来计算2个单词之间的相似度.

例如

trained_model.similarity('woman', 'man') 
0.73723527

Run Code Online (Sandbox Code Playgroud)

但是,word2vec模型无法预测句子相似性.我发现在gensim中具有句子相似性的LSI模型,但是,似乎不能与word2vec模型结合.我所拥有的每个句子的语料库长度不是很长(短于10个单词).那么,有没有简单的方法来实现目标？

python gensim word2vec

zhf*_*fkt

2016 04-12

113
推荐指数

10
解决办法

8万
查看次数

如何使用word2vec通过给出2个单词来计算相似距离？

Word2vec是一个开源工具,用于计算Google提供的单词距离.它可以通过输入单词并根据相似性输出排序的单词列表来使用.例如

输入:

france

Run Code Online (Sandbox Code Playgroud)

输出:

            Word       Cosine distance

            spain              0.678515
          belgium              0.665923
      netherlands              0.652428
            italy              0.633130
      switzerland              0.622323
       luxembourg              0.610033
         portugal              0.577154
           russia              0.571507
          germany              0.563291
        catalonia              0.534176

Run Code Online (Sandbox Code Playgroud)

但是,我需要做的是通过给出2个单词来计算相似距离.如果我给'法国'和'西班牙',我怎么能得到分数0.678515而不通过给'法国'阅读整个单词列表.

word2vec

zhf*_*fkt

2019 02-12

33
推荐指数

3
解决办法

6万
查看次数

SIFT算法中奇怪的八度值？

我在opencv代码中使用sift算法从图像中获取描述符和关键点.我的代码是

    Ptr<IplImage> image;
    vector<KeyPoint> keypoints;
    OutputArray des;

    Feature2D *descriptor_type = new SIFT()
    Mat image_mat(image);
    (*descriptor_type)(image_mat,noArray(),keypoints,des,false);

Run Code Online (Sandbox Code Playgroud)

在这里,我可以在向量<KeyPoint>中获取图像的关键点.之后,我想得到每个KeyPoint的Octave以获取更多细节.但是,当我为一个图像提供每个关键点八度值时,我想要它似乎很奇怪确认他们是否正确.

for(int i=0;i<keypoints.size();i++)
{
     cout<< (keypoints[i].octave) <<endl;
}

9765375
9765375
2621951
8323583
13763071
6488575
12845567
721407
3604991
12321279
9568767
7406079
8585727
4653567
7799295
7799295
5112319
10486271
9961983
6226431
1245951

Run Code Online (Sandbox Code Playgroud)

如果我将SIFT算法改为SURF算法,那就没问题了.

Run Code Online (Sandbox Code Playgroud)

所以我想问一下在SIFT算法中Octave值的计算是否在opencv中是正确的？

c++ opencv image-processing surf sift

zhf*_*fkt

2013 05-12

4
推荐指数

1
解决办法

1359
查看次数

标签统计

word2vec ×2

c++ ×1

gensim ×1

image-processing ×1

opencv ×1

python ×1

sift ×1

surf ×1

如何使用gensim的word2vec模型和python计算句子相似度

如何使用word2vec通过给出2个单词来计算相似距离？

SIFT算法中奇怪的八度值？

标签 统计

小编zhf_fkt的帖子

标签统计