用Python识别图像

Gio*_*gio 6 python ocr image image-processing

我对OCR识别和Python都有点新意.

我想要实现的是从Python脚本运行Tesseract来"识别".tif中的某些特定数字.

我以为我可以为Tesseract做一些培训,但我没有在Google上找到任何类似的主题,而在SO这里也没有.

基本上我有一些.tif包含几个图像(如'箭头','花'和其他图标),我希望脚本打印输出该图标的名称.如果找到箭头,则打印"箭头".

这可行吗?

Hey*_*his 1

这绝不是一个完整的答案,但如果 tif 中有多个图像并且您提前知道大小,则可以在对图像样本进行分类之前对其进行标准化。您可以将图像切割成 tif 中所有可能的矩形。

因此,当您创建分类器时(我在这里不提及方法),最终结果将综合对所有较小的矩形进行分类。

因此,如果给定 tif ,“箭头”或“花”图像为 16px x 16px ,也就是说,您可以使用 Python PIL来创建示例。

from PIL import Image

image_samples = []

im = Image.open("input.tif")
sample_dimensions = (16,16)

for box in get_all_corner_combinations(im, sample_dimensions):

    image_samples.append(im.crop(box))


classifier = YourClassifier()

classifications = []

for sample in image_samples:
    classifications.append (classifier (sample))

label = fuse_classifications (classifications)
Run Code Online (Sandbox Code Playgroud)

再说一次,我没有谈论实际写作的学习步骤YourClassifier。但希望这有助于解决部分问题。

关于学习图像分类以及在分类之前清除图像中的噪声这一主题有很多研究。

考虑浏览这个现有 Python 机器学习库的精彩集合。

http://scipy-lectures.github.com/advanced/scikit-learn/index.html

还有许多与图像相关的技术。