我有兴趣使用OCR从简单的文本中提取粗体和斜体字.例如,如果我输入带有文本的清晰图像,如下所示:
"快速的棕色狐狸跳在懒惰的狗."
我想得到一个像这样的输出:粗体("棕色","跳跃"),斜体("懒惰")
我已经考虑过使用OCRopus或Tesseract进行此操作,但文档很差,我无法判断它是否可行,或者如果它可以如何实现.
ocr tesseract font-face
font-face ×1
ocr ×1
tesseract ×1