相关疑难解决方法(0)

R:使用jarowinkler进行字符串模糊匹配

我在R中有两个类型字符向量

我希望能够使用jarowinkler将引用列表与原始字符列表进行比较,并指定%相似度得分.因此,例如,如果我有10个参考项目和20个原始数据项目,我希望能够获得比较的最佳分数以及算法与之匹配的内容(因此2个向量为10).如果我有大小为8和10个参考项目的原始数据,我应该只得到8个项目的2个向量结果,每个项目的匹配和得分最高

item,match,matched_to ice,78,ice-cream

下面是我的代码,没什么可看的.

NumItems.Raw = length(words)
NumItems.Ref = length(Ref.Desc)

for (item in words) 
{
  for (refitem in Ref.Desc)
  {
    jarowinkler(refitem,item)

    # Find Best match Score
    # Find Best Item in reference table
    # Add both items to vectors
    # decrement NumItems.Raw
    # Loop
  }
} 
Run Code Online (Sandbox Code Playgroud)

string r levenshtein-distance

6
推荐指数
1
解决办法
5093
查看次数

标签 统计

levenshtein-distance ×1

r ×1

string ×1