如何在Python中计算两个单词含义中的距离

bha*_*557 5 python nlp nltk

我想知道是否有可能计算Python中两个相关单词（例如“欺诈”和“窃取”）之间的距离/相似度。这两个词本身不是同义词，但它们显然相关。NLP中是否有任何概念/算法可以以数字方式显示这种关系？也许通过NLTK？

我不是在寻找Levenshtein距离，因为Levenshtein距离与组成一个单词的各个字符有关。我在寻找含义。

希望提供的任何帮助。

我的建议如下：

将每个单词放入相同的同义词库中，以获得同义词列表。
获取这两个单词的相似同义词集的大小。
这是单词之间相似性的度量。

如果您想做更彻底的分析：

还要获取这两个单词的反义词。
获取两个单词的反义词集交集的大小。

如果你还想走得更远！...

将每个单词放入相同的同义词库中，以获得同义词列表。
使用查询结果中的前 n 个（=5，或其他）单词来发起新的查询。
重复此操作直至您认为足够的深度。
从重复的同义词查询中收集同义词集合。
从两个同义词集合中获取两个单词的相似同义词集合的大小。
这是单词之间相似性的度量。

归档时间：	9 年，1 月前
查看次数：	975 次
最近记录：	6 年，5 月前

如何使用Python NLTK计算WordNet中两个形容词之间的最短路径(测地)距离？ 5

更多相关链接

在交互时重新导入python中的模块 330

将timedelta转换为天,小时和分钟 220

给定一百万个数字的字符串,返回所有重复的3位数字 137

为什么 a.insert(0,0) 比 a[0:0]=[0] 慢得多？ 70

你可以修补*只是一个带闭包的嵌套函数,还是必须重复整个外部函数？ 48

从Linux上的命令队列进行并行处理(bash,python,ruby ......等等) 44

urlencode一组值 42

.NET的自然语言日期/时间解析器？ 26

在unigram语言模型中计算单字组概率时,"字数统计"是指什么？ 5

使用pdfminer检测pdf的部分 4

如何有效地配对袜子？ 3850

确定已安装的PowerShell版本 2543

需要一个没有任何子弹的无序列表 2408

如何用Vim中的换行符替换字符？ 1870

Vim清除上次搜索突出显示 1824

为什么模板只能在头文件中实现？ 1660

你如何合并两个Git存储库？ 1517

在Python中创建一个包含列表推导的字典 1216

macOS Mojave Update后,Git无法正常工作(xcrun:错误:无效的活动开发者路径(/ Library/Developer/CommandLineTools) 1190

Git:如何在项目提交历史中找到已删除的文件？ 1183