我是文本提取的新手.当我尝试使用pytesseract从png图像中提取文本时
from PIL import Image
import pytesseract
s=Image.open('d:\\test.png')
print(pytesseract.image_to_string(s))
Run Code Online (Sandbox Code Playgroud)
我收到错误了
这是image(test.png)的问题.the test.png是一个号牌的图像.我应该安装其他任何东西.
我有一组文本文件,我试图将其读入单个列表.但是当我执行我的代码时
def get_documents():
path1 = "D:/set/"
texts=[]
listing1 = os.listdir(path1)
for file in listing1:
with open(path1+file,'r') as f:
lines = f.read().splitlines()
texts.append(lines)
print texts
Run Code Online (Sandbox Code Playgroud)
我将输出作为列表列表
[['Wanna see Riya Somani :) wish lyf olso moment lyk end half galfrnd... :) '], ['Worst book Mr. Chetan Bhagat.. Plz better stori ']]
Run Code Online (Sandbox Code Playgroud)
我怎样才能将它作为一个列表?
我正在尝试将浮点数形式(hh.mm)的时间除以整数。例如,1.30 x 2必须为00.45。有没有简单的方法可以做到这一点?
我有一个字符串形式的数组
"[{"img_type":"HA","img_size":0,"img_name":"8a040ff1-e780-4843-9f01-6dc37e11f3c8"},{"img_type":"HB","img_size":0,"img_name":"8a040ff1-e780-4843-9f01-6dc37e11f3c8"}]"
Run Code Online (Sandbox Code Playgroud)
我需要将其转换为
[
{"img_type": "HA", "img_size": 0, "img_name": "8a040ff1-e780-4843-9f01-6dc37e11f3c8"},
{"img_type": "HB", "img_size": 0, "img_name": "8a040ff1-e780-4843-9f01-6dc37e11f3c8"}
]
Run Code Online (Sandbox Code Playgroud)
我尝试删除双引号,但它没有用.如何将其转换为数组?