python Fuzzywuzzy 限制,它是如何工作的?

a12*_*234 1 fuzzy fuzzy-logic python-3.x fuzzywuzzy

极限是如何与 python 的fuzzywuzzy 模块一起工作的,它是什么意思?

matches = process.extract(query, choices, limit=2, scorer=fuzz.partial_ratio)
Run Code Online (Sandbox Code Playgroud)

Rah*_*wal 5

当您需要“x”个最佳匹配解决方案时,限制通常用于模糊模糊。

因此,例如,您正在比较 df 的同一列以相互匹配。第一次匹配将是名称本身的情况。因此,您确实limit = 2获得了第二个最佳匹配。

Ex: column values =['Apple','Banana','Orange','Appl','Banan']
Run Code Online (Sandbox Code Playgroud)

如果您想使用同一列进行模糊处理,并查看由于拼写错误等原因在不同上下文中如何使用“Apple”。现在 Apple 的最佳匹配将是 Apple 本身,因此在这种情况下您确实limit=2会得到“ Appl

我希望我很清楚