我正在尝试使用OpenCV从iPhone游戏Blocked "解析"屏幕截图.屏幕截图裁剪为如下所示:

我想现在我只是想找到构成每个矩形的4个点中每个点的坐标.我确实看到了OpenCV附带的示例文件squares.c,但是当我在这张图片上运行该算法时,它会出现72个矩形,包括空格的矩形区域,我显然不想算作我的一个矩形.有什么更好的方法来解决这个问题?我尝试过一些谷歌研究,但对于所有的搜索结果,几乎没有相关的可用信息.
我正在尝试从 PDF 中提取印地语文本。我尝试了所有从 PDF 中提取的方法,但都没有奏效。有解释为什么它不起作用,但没有这样的答案。因此,我决定将PDF转换为图像,然后用于pytesseract提取文本。我已经下载了印地语训练的数据,但是这也提供了非常不准确的文本。
这是 PDF 中的实际印地语文本(下载链接):
到目前为止,这是我的代码:
import fitz
filepath = "D:\\BADI KA BANS-Ward No-002.pdf"
doc = fitz.open(filepath)
page = doc.loadPage(3) # number of page
pix = page.getPixmap()
output = "outfile.png"
pix.writePNG(output)
from PIL import Image
import pytesseract
# Include tesseract executable in your path
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
# Create an image object of PIL library
image = Image.open('outfile.png')
# pass image into pytesseract module
# pytesseract is trained in many languages
image_to_text …Run Code Online (Sandbox Code Playgroud)