a12*_*234 1 fuzzy fuzzy-logic python-3.x fuzzywuzzy
极限是如何与 python 的fuzzywuzzy 模块一起工作的,它是什么意思?
matches = process.extract(query, choices, limit=2, scorer=fuzz.partial_ratio)
Run Code Online (Sandbox Code Playgroud)
当您需要“x”个最佳匹配解决方案时,限制通常用于模糊模糊。
因此,例如,您正在比较 df 的同一列以相互匹配。第一次匹配将是名称本身的情况。因此,您确实limit = 2获得了第二个最佳匹配。
Ex: column values =['Apple','Banana','Orange','Appl','Banan']
Run Code Online (Sandbox Code Playgroud)
如果您想使用同一列进行模糊处理,并查看由于拼写错误等原因在不同上下文中如何使用“Apple”。现在 Apple 的最佳匹配将是 Apple 本身,因此在这种情况下您确实limit=2会得到“ Appl ”
我希望我很清楚