如何检查文本覆盖的图像的百分比？

Question

如何检查文本覆盖的图像的百分比？

Jul*_*Jul 1 javascript python opencv image-processing node.js

有没有办法以编程方式计算文本覆盖图像的百分比？我正在尝试在 node.js 或 python 中执行此操作，但似乎找不到任何可以执行此操作的内容-我找到了很多可让您分析文本和/或更改图像属性本身的库（tesseract最初看起来很有希望），但没有什么可以给我回一个区域或数量——通常只是文本本身。任何想法将不胜感激，对于我尝试过的缺少代码感到抱歉，但在任何地方都找不到任何关于此的信息。

Answer 1

nat*_*ncy 5

这是在 OpenCV 中使用阈值 + 轮廓过滤的潜在方法：

将图像转换为灰度和自适应阈值
使用定义的阈值查找轮廓并过滤以删除所有非文本轮廓
将非文本轮廓绘制到掩码上并按位异或以仅获取文本
计算文本像素的百分比

由于您没有提供输入图像，我将使用教科书中的示例图像。注意一些文本是彩色的，并且有一张图片来模拟带有文本的普通图像。

我们首先将图像转换为灰度和自适应阈值cv2.adaptiveThreshold()以获得二值图像。

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.adaptiveThreshold(gray,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV,11,3)

Run Code Online (Sandbox Code Playgroud)

接下来，我们使用找到轮廓cv2.findContours()并使用轮廓区域进行过滤cv2.contourArea()。我们定义一个picture_threshold值来定义非文本轮廓的阈值。本质上，这个值决定了如果轮廓太大，它一定是一张图片，所以我们要从我们的图像中过滤掉这些轮廓。在这种情况下，我们将非文本轮廓定义为任何大于5%图像大小的轮廓。这是一个不错的假设，因为单个单词不会大于1%整个图像区域的大小（除非它是徽标，但我们假设只是普通文本）。

阈值二值图像（左）和蒙版上过滤的非文本轮廓（右）

mask = thresh.copy()
mask = cv2.merge([mask,mask,mask])

picture_threshold = image.shape[0] * image.shape[1] * .05
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c in cnts:
    area = cv2.contourArea(c)
    if area < picture_threshold:
        cv2.drawContours(mask, [c], -1, (0,0,0), -1)

Run Code Online (Sandbox Code Playgroud)

为了去除不需要的轮廓，我们执行按位异或操作以获得仅包含文本的过滤图像。这是我们将计算文本像素百分比的图像。

mask = cv2.cvtColor(mask, cv2.COLOR_BGR2GRAY)
result = cv2.bitwise_xor(thresh, mask)

Run Code Online (Sandbox Code Playgroud)

由于我们仅隔离了图像上的文本轮廓，因此我们只需使用计算图像上的白色像素数cv2.countNonZero()。我们可以通过除以图像的面积来获得文本像素的百分比。结果如下：

百分比：13.15%

text_pixels = cv2.countNonZero(result)
percentage = (text_pixels / (image.shape[0] * image.shape[1])) * 100
print('Percentage: {:.2f}%'.format(percentage))

Run Code Online (Sandbox Code Playgroud)

完整代码

import cv2
import numpy as np

image = cv2.imread('1.png')
gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
thresh = cv2.adaptiveThreshold(gray,255,cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY_INV,11,3)

mask = thresh.copy()
mask = cv2.merge([mask,mask,mask])

picture_threshold = image.shape[0] * image.shape[1] * .05
cnts = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)
cnts = cnts[0] if len(cnts) == 2 else cnts[1]
for c in cnts:
    area = cv2.contourArea(c)
    if area < picture_threshold:
        cv2.drawContours(mask, [c], -1, (0,0,0), -1)

mask = cv2.cvtColor(mask, cv2.COLOR_BGR2GRAY)
result = cv2.bitwise_xor(thresh, mask)

text_pixels = cv2.countNonZero(result)
percentage = (text_pixels / (image.shape[0] * image.shape[1])) * 100
print('Percentage: {:.2f}%'.format(percentage))

cv2.imshow('thresh', thresh)
cv2.imshow('result', result)
cv2.imshow('mask', mask)
cv2.waitKey()

Run Code Online (Sandbox Code Playgroud)

不确定 OP 打算做什么，但它可以在分析广告图像中的文本时发挥作用。显然，文本少于 20% 的图像效果更好。看看[广告图片中的 Facebook 文字](https://www.facebook.com/business/help/980593475366490?id=1240182842783684)。Facebook 已经实现了这个[确定广告图像中有多少文本的工具](https://www.facebook.com/ads/tools/text_overlay) (2认同)

归档时间：	6 年，1 月前
查看次数：	1296 次
最近记录：	6 年，1 月前