相关疑难解决方法(0)

查找重复邮寄地址的策略

我试图找出一种基于相似性得分找到重复地址的方法.考虑这些重复的地址:

addr_1 = '# 3 FAIRMONT LINK SOUTH'
addr_2 = '3 FAIRMONT LINK S'

addr_3 = '5703 - 48TH AVE'
adrr_4 = '5703- 48 AVENUE'
Run Code Online (Sandbox Code Playgroud)

我正计划应用一些字符串转换来缩写长字,例如NORTH - > N,删除所有空格,逗号和短划线以及磅符号.现在,有了这个输出,我如何将addr_3与其余地址进行比较并检测类似的?相似度的百分比是安全的吗?你能为此提供一个简单的python代码吗?

addr_1 = '3FAIRMONTLINKS'
addr_2 = '3FAIRMONTLINKS'

addr_3 = '570348THAV'
adrr_4 = '570348AV'
Run Code Online (Sandbox Code Playgroud)

感恩,

爱德华多

python similarity duplicates mailing street-address

5
推荐指数
1
解决办法
4262
查看次数

标签 统计

duplicates ×1

mailing ×1

python ×1

similarity ×1

street-address ×1