我使用 Pytesseract 对屏幕截图运行大量 OCR。这在大多数情况下运行良好,但少数情况会导致此错误:
pytesseract.image_to_string(image,None, False, "-psm 6")
Pytesseract: UnicodeDecodeError: 'charmap' codec can't decode byte 0x9d in position 2: character maps to <undefined>
Run Code Online (Sandbox Code Playgroud)
我正在使用Python 3.4。任何如何防止此错误发生的建议(不仅仅是尝试/例外)都会非常有帮助。
我正在尝试使用框绘图字符来编写tiff图像,但所有相关字符都显示为: 
框绘制字符(例如"┌─┐│└┘╞═╡╤╧╘╛")直接粘贴到源代码中,并且在保存到文本文件时它们会正确显示,但我不明白为什么它们'没有出现在图像上.
这是我用来绘制图像的代码示例:
# coding=utf-8
text = "?????????????"
from PIL import Image, ImageDraw, ImageFont, TiffImagePlugin
img = Image.new("1",(1200,1600),1)
font = ImageFont.truetype("cour.ttf",14,encoding="unic")
draw = ImageDraw.Draw(img)
draw.text((40,0), text, font=font, fill=0)
img.save("imagefile.tif","TIFF")
Run Code Online (Sandbox Code Playgroud)
我在Windows 7上使用python版本2.7.2.