小编Moh*_* ah的帖子

如何在图像中找到类似结构的表格

我有发票文件,我想在每张发票中找到表格.这个表位置不会是常数.所以我来图像处理.首先,我尝试将发票转换为图像.然后我发现基于表格边框的轮廓最终占据了表格位置.我使用下面的代码来完成我的任务.

with Image(page) as page_image:
    page_image.alpha_channel = False #eliminates transperancy
    img_buffer=np.asarray(bytearray(page_image.make_blob()), dtype=np.uint8)
    img = cv2.imdecode(img_buffer, cv2.IMREAD_UNCHANGED)

    ret, thresh = cv2.threshold(img, 127, 255, 0)
    im2, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    margin=[]
    for contour in contours:
        # get rectangle bounding contour
        [x, y, w, h] = cv2.boundingRect(contour)
        # Don't plot small false positives that aren't text
        if (w >thresh1 and h> thresh2):
                margin.append([x, y, x + w, y + h])
    #data cleanup on margin to extract required position values.
Run Code Online (Sandbox Code Playgroud)

在此代码中thresh1 …

python opencv image image-processing

23
推荐指数
3
解决办法
2万
查看次数

如何删除图像Python中的水印背景

我有一个如下图像,

在此输入图像描述

我想删除背景水印.

到目前为止,我试过,inpainting方法opencv.它没有帮助我.

我试过以下脚本:

edges = cv2.Canny(img,50,150,apertureSize = 3)
dst = cv2.inpaint(img,edges,3,cv2.INPAINT_TELEA)
Run Code Online (Sandbox Code Playgroud)

我是图像处理的新手opencv.所以,我不知道我是否以正确的方式进行修复.我应该采取什么方法来删除背景水印.

我想从我的图像中删除绿色引号水印.

在此输入图像描述

任何帮助都会更加明显.

opencv image image-processing

14
推荐指数
1
解决办法
7728
查看次数

删除pandas中列的最佳方法是什么

我正在为自学而提出这个问题.据我所知,以下是删除pandas数据帧中列的不同方法.

选项1:

df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]})
del df['a']
Run Code Online (Sandbox Code Playgroud)

选项-2:

df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]})
df=df.drop('a',1)
Run Code Online (Sandbox Code Playgroud)

选项-3:

df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]})
df=df[['b','c']]
Run Code Online (Sandbox Code Playgroud)
  1. 这些中最好的方法是什么?
  2. 有没有其他方法可以实现相同的目标?

python dataframe pandas

11
推荐指数
2
解决办法
2万
查看次数

在Python中将dict转换为另一个结构

我有一个如下的字典:

{'activity_count': [10, 11, 12], 'type': ['all', 'paper', 'fpy']}
Run Code Online (Sandbox Code Playgroud)

我想将这个字典转换成这种形式:

{'all': {'activity_count': 10}, 'paper': {'activity_count': 11}, 'fpy': {'activity_count': 12}}
Run Code Online (Sandbox Code Playgroud)

我怎么解决这个问题?

到目前为止我试过这个解决方案

dic={"activity_count":[10,11,12],"type":["all","paper","fpy"]}
in={}
i=0
for val in dic['type']:
    for v in dic['activity_count']:
        if i== dic['activity_count'].index(v):
            temp={}
            temp['activity_count']=v
            fin[val]=temp
    i+=1
Run Code Online (Sandbox Code Playgroud)

它按照我的预期工作,但它看起来非常无效的方式来完成这项任务.有没有办法解决这个问题?

python

10
推荐指数
2
解决办法
904
查看次数

如何在熊猫中考虑NaN生成序列

我有一个包含NaN和True作为值的系列.我想要另一个系列来生成一个数字序列,这样每当NaN将该系列值设置为0并且在两个NaN行之间我需要执行cumcount.

输入:

colA
NaN
True
True
True
True
NaN
True
NaN
NaN
True
True
True
True
True
Run Code Online (Sandbox Code Playgroud)

产量

ColA    Sequence
NaN     0
True    0
True    1
True    2
True    3
NaN     0
True    0
NaN     0
NaN     0
True    0
True    1
True    2
True    3
True    4
Run Code Online (Sandbox Code Playgroud)

如何在熊猫中执行此操作?

python boolean nan pandas cumsum

9
推荐指数
2
解决办法
921
查看次数

无论如何,我可以修改 get-login-password 令牌的过期时间吗?

我能够使用 获取令牌来访问 aws ecr get-login-password。默认授权令牌的有效期为 12 小时。无论如何我可以修改默认值吗?

amazon-web-services aws-ecr

9
推荐指数
1
解决办法
2726
查看次数

我无法从keras.applications模块导入resnet

我无法导入此模块

import keras.applications.resnet
Run Code Online (Sandbox Code Playgroud)

ModuleNotFoundError
在()----> 1个进口keras.applications.resnet

ModuleNotFoundError: No module named 'keras.applications.resnet'


keras resnet 链接

keras tensorflow resnet

8
推荐指数
4
解决办法
9901
查看次数

=> 在朱莉娅中的目的是什么

根据我的理解,=>过去常常将字符串绑定为变量名。

例如,

df1 = DataFrame(x=1:2, y= 11: 12)

df2 = DataFrame("x"=>1:2, "y"=> 11: 12)
Run Code Online (Sandbox Code Playgroud)

两者都返回相同的结果,

? Row ? x     ? y     ?
?     ? Int64 ? Int64 ?
???????????????????????
? 1   ? 1     ? 11    ?
? 2   ? 2     ? 12    ?
Run Code Online (Sandbox Code Playgroud)

这里唯一的区别是 indf1x变量保持,1:2而 indf2"x"字符串保持1:2。所以,从上面的结果,我假设从我可以使用的字符串创建变量=>

但是当我尝试在像下面这样的简单变量中保存值时

x = 10

开/关: 10

"y"=>10

开/关: "y" => 10

这个结果我无法理解。当我打印x它时,它10符合预期。但是当我打印时,y我得到了 …

julia

8
推荐指数
1
解决办法
156
查看次数

为什么 julia 需要很长时间才能导入一个包?

我很关心性能。因此,我将其创建为关于首次调用或导入包时的延迟问题。这可能是一个愚蠢的问题。

当我第一次为 ex 添加包时,Plots 会消耗一些时间来构建包。再次,当我第一次在我的笔记本上导入包时,也花了一些时间(~1 分钟)说Precompiling message 导入包后,当我点击plot()这也会消耗一些时间(30 秒 - 60 秒)并最终返回一个情节。

一旦我使用了绘图功能,下次使用时就不会花费太多时间来产生结果。

每当我重新启动笔记本时,就会发生这种延迟。

我猜它是在执行之前编译函数。因为与 python 不同,julia 不是脚本语言。所以,它应该经过编译。但是,为什么每次重启笔记本时都会出现延迟?

无论如何我可以抑制这种延迟吗?无论如何,我可以预编译一次所有内容,以便下次在病房中我看不到任何延迟,而不必担心笔记本或 Julia 终端中的内核重启。为什么会发生延迟?完全是因为编译时间还是取决于我的机器?

julia

7
推荐指数
1
解决办法
874
查看次数

How to compress a picture less than a limit file size using python PIL library?

我需要将图片发送到另一个地方,那里要求图片大小必须小于512kb。
我用来PIL处理从互联网下载的图片。所以我不知道下一张图片的尺寸是多少,代码如下:

from PIL import Image
picture_location = '/var/picture/1233123.jpg'
compressed_picture_location = '/var/picture/1233123_compressed.jpg'
im = Image.open(picture_location)
quality = 75
im.save(compressed_picture_location, quality=quality)
im.save()
Run Code Online (Sandbox Code Playgroud)

问题是压缩图片的文件大小不是原始图片的75%或75%*75%,所以我必须压缩它,统计它,再次压缩,我无法选择合适的质量值。

还有其他方法可以解决这个问题吗?请帮助或尝试给出一些如何实现这一目标的想法。

python python-imaging-library

6
推荐指数
1
解决办法
7300
查看次数