R中的快速Levenshtein距离?

mbq*_*mbq 25 performance packages r levenshtein-distance stringdist

是否有包含Levenshtein距离计数功能的包,它是作为C或Fortran代码实现的?我有很多的字符串进行比较,并stringMatchMiscPsycho对这个太慢了.

Geo*_*tas 18

levenshteinDist(来自RecordLinkage包)调用编译的C代码.试试看.

  • 只是注意到 RecordLinkage 包显然不再维护并且已从 CRAN 中删除。`stringdist` 包现在就是解决方案。 (2认同)

Ben*_*Ben 14

stringdiststringdist包确实太,甚至快于levenshteinDist一定的条件下,(1)

  • 自从您链接到的博客以来,stringdist已大幅加速:它现在使用多个核心. (2认同)

Aar*_*ham 6

你可以尝试stringDistBiostrings以及