标签: fuzzy-comparison

使用Python/PIL比较(类似)图像

我正在尝试使用Python 2.6和PIL 计算两个图像的相似度(读取:Levenshtein距离).

我计划用python-levenshtein库进行快速比较.

主要问题:

比较图像的好策略是什么？我的想法是这样的:

转换为RGB(透明 - >白色)(或者转换为单色？)
将较小的一个放大到较大的一个
将每个通道(=唯一通道,如果转换为单色)转换为序列(项值=像素的颜色值)
计算两个序列之间的Levenshtein距离

当然,这不会处理镜像图像,裁剪图像等情况.但是对于基本比较,这应该是有用的.

在某处记录了更好的策略吗？

编辑: Aaron H对速度问题是正确的.对于大于几百乘几百像素的图像,计算Levelshtein需要永远.但是,在我的示例中缩小到100x100和200x200之后的结果之间的差异小于1%,因此将最大图像大小设置为~100px左右可能是明智的...

编辑:感谢PreludeAndFugue,这个问题就是我想要的.

顺便说一句,Levenshtein的距离似乎可以优化,但它给了我一些非常糟糕的结果,也许是因为背景中有很多冗余元素.要看一些其他算法.

EIDT:均方根偏差和峰值信噪比似乎是另外两个选项,不是很难实现,看起来不是很昂贵.但是,似乎我需要某种上下文分析来识别形状等.

无论如何,感谢所有的链接,并指出朝向NumPy/SciPy的方向.

python fuzzy-logic fuzzy-comparison python-imaging-library

Att*_* O.

2015 11-01

8
推荐指数

2
解决办法

9249
查看次数

Python中的规范URL比较？

是否有任何工具可以在Python中进行URL比较？

例如,如果我有http://google.com,google.com/我想知道他们可能是同一个网站.

如果我要手动构建一个规则,我可能会大写它,然后剥离该http://部分,并删除最后一个字母数字字符后的任何内容..但我可以看到这个失败,因为我相信你也可以.

有没有这样做的图书馆？你会怎么做？

python fuzzy-comparison

Col*_*vis

2010 07-20

8
推荐指数

1
解决办法

2526
查看次数

在Python中生成两个文件的"模糊"差异,并对浮点数进行近似比较

我有比较两个文件的问题.基本上,我想要做的是两个文件之间类似于UNIX的差异,例如:

$ diff -u左文件右文件

但是我的两个文件包含浮点数; 并且因为这些文件是在不同的体系结构上生成的(但是计算相同的东西),浮动值并不完全相同(它们可能因1e-10而不同).但我通过'差异'文件寻找的是找到我认为是显着差异的东西(例如差异大于1e-4); 使用UNIX命令diff时,几乎所有包含浮动值的行都不同!这是我的问题:我如何得到像'diff -u'提供的结果差异,但对浮点数比较的限制较少？

我以为我会写一个Python的脚本来做到这一点,并找到了模块difflib,它提供了类似diff的比较.但是我发现的文档解释了如何按原样使用它(通过单一方法),并解释了内部对象,但我找不到任何关于如何自定义difflib对象以满足我的需求(比如仅重写比较方法或...)我想解决方案可能是检索统一的差异,然后"手动"解析它以消除我的"错误"差异,这不是优雅的; 我更愿意使用现有的框架.

那么,有没有人知道如何自定义这个lib,以便我可以做我想要的东西？或者至少指出我正确的方向......如果不是在Python中,也许shell脚本可以完成工作？

任何帮助将不胜感激!提前感谢您的回答!

python floating-point fuzzy-comparison inexact-arithmetic

piw*_*iwi

2015 10-09

7
推荐指数

1
解决办法

1775
查看次数

如何基于相似度函数合并两个pandas DataFrames？

给定数据集 1

name,x,y
st. peter,1,2
big university portland,3,4

标签 统计

标签统计