相关疑难解决方法(0)

给出2个句子字符串计算余弦相似度

Python:tf-idf-cosine:为了找到文档相似性,可以使用tf-idf余弦计算文档相似度.没有导入外部库,是否有任何方法可以计算2个字符串之间的余弦相似度?

s1 = "This is a foo bar sentence ."
s2 = "This sentence is similar to a foo bar sentence ."
s3 = "What is this string ? Totally not related to the other two lines ."

cosine_sim(s1, s2) # Should give high cosine similarity
cosine_sim(s1, s3) # Shouldn't give high cosine similarity value
cosine_sim(s2, s3) # Shouldn't give high cosine similarity value
Run Code Online (Sandbox Code Playgroud)

python string nlp similarity cosine-similarity

69
推荐指数
3
解决办法
9万
查看次数

NLP:找到单词之间语义相似性的任何简单方法?

我不知道StackOverflow是否涵盖了NLP,所以我要试一试.我有兴趣找到来自特定领域的两个单词的语义相关性,即"图像质量"和"噪声".我正在做一些研究,以确定相机的特定属性的相机评论是正面还是负面.(就像每个评论中的图像质量一样).

然而,并非所有人都在帖子中使用完全相同的措辞"图像质量",所以我出去看看是否有办法让我构建这样的东西:

"图像质量",包括("噪音","颜色","清晰度"等),所以我可以把所有的东西都包在一把大伞里.

我这样做是为了另一种语言,所以Wordnet不一定有用.不,我不为谷歌或微软工作,所以我没有人们点击行为的数据作为输入数据.

但是,我确实有很多文字,pos-tagged,segmented等.

nlp

21
推荐指数
3
解决办法
1万
查看次数

标签 统计

nlp ×2

cosine-similarity ×1

python ×1

similarity ×1

string ×1