小编Moh*_* ah的帖子

如何在图像中找到类似结构的表格

我有发票文件,我想在每张发票中找到表格.这个表位置不会是常数.所以我来图像处理.首先,我尝试将发票转换为图像.然后我发现基于表格边框的轮廓最终占据了表格位置.我使用下面的代码来完成我的任务.

with Image(page) as page_image:
    page_image.alpha_channel = False #eliminates transperancy
    img_buffer=np.asarray(bytearray(page_image.make_blob()), dtype=np.uint8)
    img = cv2.imdecode(img_buffer, cv2.IMREAD_UNCHANGED)

    ret, thresh = cv2.threshold(img, 127, 255, 0)
    im2, contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    margin=[]
    for contour in contours:
        # get rectangle bounding contour
        [x, y, w, h] = cv2.boundingRect(contour)
        # Don't plot small false positives that aren't text
        if (w >thresh1 and h> thresh2):
                margin.append([x, y, x + w, y + h])
    #data cleanup on margin to extract required position values.

Run Code Online (Sandbox Code Playgroud)

在此代码中thresh1 …

python opencv image image-processing

Moh*_* ah

2019 06-14

23
推荐指数

3
解决办法

2万
查看次数

如何删除图像Python中的水印背景

我有一个如下图像,

我想删除背景水印.

到目前为止,我试过,inpainting方法opencv.它没有帮助我.

我试过以下脚本:

edges = cv2.Canny(img,50,150,apertureSize = 3)
dst = cv2.inpaint(img,edges,3,cv2.INPAINT_TELEA)

Run Code Online (Sandbox Code Playgroud)

我是图像处理的新手opencv.所以,我不知道我是否以正确的方式进行修复.我应该采取什么方法来删除背景水印.

我想从我的图像中删除绿色引号水印.

任何帮助都会更加明显.

opencv image image-processing

Moh*_* ah

2018 06-11

14
推荐指数

1
解决办法

7728
查看次数

删除pandas中列的最佳方法是什么

我正在为自学而提出这个问题.据我所知,以下是删除pandas数据帧中列的不同方法.

选项1:

df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]})
del df['a']

Run Code Online (Sandbox Code Playgroud)

选项-2:

df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]})
df=df.drop('a',1)

Run Code Online (Sandbox Code Playgroud)

选项-3:

df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]})
df=df[['b','c']]

Run Code Online (Sandbox Code Playgroud)

这些中最好的方法是什么？
有没有其他方法可以实现相同的目标？

python dataframe pandas

Moh*_* ah

2019 08-21

11
推荐指数

2
解决办法

2万
查看次数

在Python中将dict转换为另一个结构

我有一个如下的字典:

{'activity_count': [10, 11, 12], 'type': ['all', 'paper', 'fpy']}

Run Code Online (Sandbox Code Playgroud)

我想将这个字典转换成这种形式:

{'all': {'activity_count': 10}, 'paper': {'activity_count': 11}, 'fpy': {'activity_count': 12}}

Run Code Online (Sandbox Code Playgroud)

我怎么解决这个问题？

到目前为止我试过这个解决方案

dic={"activity_count":[10,11,12],"type":["all","paper","fpy"]}
in={}
i=0
for val in dic['type']:
    for v in dic['activity_count']:
        if i== dic['activity_count'].index(v):
            temp={}
            temp['activity_count']=v
            fin[val]=temp
    i+=1

Run Code Online (Sandbox Code Playgroud)

它按照我的预期工作,但它看起来非常无效的方式来完成这项任务.有没有办法解决这个问题？

python

Moh*_* ah

2018 07-24

10
推荐指数

2
解决办法

904
查看次数

如何在熊猫中考虑NaN生成序列

我有一个包含NaN和True作为值的系列.我想要另一个系列来生成一个数字序列,这样每当NaN将该系列值设置为0并且在两个NaN行之间我需要执行cumcount.

即

输入:

colA
NaN
True
True
True
True
NaN
True
NaN
NaN
True
True
True
True
True

Run Code Online (Sandbox Code Playgroud)

产量

ColA    Sequence
NaN     0
True    0
True    1
True    2
True    3
NaN     0
True    0
NaN     0
NaN     0
True    0
True    1
True    2
True    3
True    4

Run Code Online (Sandbox Code Playgroud)

如何在熊猫中执行此操作？

python boolean nan pandas cumsum

Moh*_* ah

2018 02-08

9
推荐指数

2
解决办法

921
查看次数

无论如何，我可以修改 get-login-password 令牌的过期时间吗？

我能够使用获取令牌来访问 aws ecr get-login-password。默认授权令牌的有效期为 12 小时。无论如何我可以修改默认值吗？

amazon-web-services aws-ecr

Moh*_* ah

lucky-day

9
推荐指数

1
解决办法

2726
查看次数

我无法从keras.applications模块导入resnet

我无法导入此模块

import keras.applications.resnet

Run Code Online (Sandbox Code Playgroud)

ModuleNotFoundError
在（）----> 1个进口keras.applications.resnet

ModuleNotFoundError: No module named 'keras.applications.resnet'

keras resnet 链接

keras tensorflow resnet

Aay*_*jaj

2019 02-14

8
推荐指数

4
解决办法

9901
查看次数

=> 在朱莉娅中的目的是什么

根据我的理解，=>过去常常将字符串绑定为变量名。

例如，

df1 = DataFrame(x=1:2, y= 11: 12)

df2 = DataFrame("x"=>1:2, "y"=> 11: 12)

Run Code Online (Sandbox Code Playgroud)

两者都返回相同的结果，

? Row ? x     ? y     ?
?     ? Int64 ? Int64 ?
???????????????????????
? 1   ? 1     ? 11    ?
? 2   ? 2     ? 12    ?

Run Code Online (Sandbox Code Playgroud)

这里唯一的区别是 indf1的x变量保持，1:2而 indf2的"x"字符串保持1:2。所以，从上面的结果，我假设从我可以使用的字符串创建变量=>。

但是当我尝试在像下面这样的简单变量中保存值时

x = 10

开/关： 10

"y"=>10

开/关： "y" => 10

这个结果我无法理解。当我打印x它时，它10符合预期。但是当我打印时，y我得到了 …

julia

Moh*_* ah

lucky-day

8
推荐指数

1
解决办法

156
查看次数

为什么 julia 需要很长时间才能导入一个包？

我很关心性能。因此，我将其创建为关于首次调用或导入包时的延迟问题。这可能是一个愚蠢的问题。

当我第一次为 ex 添加包时，Plots 会消耗一些时间来构建包。再次，当我第一次在我的笔记本上导入包时，也花了一些时间（~1 分钟）说Precompiling message 导入包后，当我点击plot()这也会消耗一些时间（30 秒 - 60 秒）并最终返回一个情节。

一旦我使用了绘图功能，下次使用时就不会花费太多时间来产生结果。

每当我重新启动笔记本时，就会发生这种延迟。

我猜它是在执行之前编译函数。因为与 python 不同，julia 不是脚本语言。所以，它应该经过编译。但是，为什么每次重启笔记本时都会出现延迟？

无论如何我可以抑制这种延迟吗？无论如何，我可以预编译一次所有内容，以便下次在病房中我看不到任何延迟，而不必担心笔记本或 Julia 终端中的内核重启。为什么会发生延迟？完全是因为编译时间还是取决于我的机器？

julia

Moh*_* ah

lucky-day

7
推荐指数

1
解决办法

874
查看次数

How to compress a picture less than a limit file size using python PIL library?

我需要将图片发送到另一个地方，那里要求图片大小必须小于512kb。
我用来PIL处理从互联网下载的图片。所以我不知道下一张图片的尺寸是多少，代码如下：

from PIL import Image
picture_location = '/var/picture/1233123.jpg'
compressed_picture_location = '/var/picture/1233123_compressed.jpg'
im = Image.open(picture_location)
quality = 75
im.save(compressed_picture_location, quality=quality)
im.save()

Run Code Online (Sandbox Code Playgroud)

问题是压缩图片的文件大小不是原始图片的75%或75%*75%，所以我必须压缩它，统计它，再次压缩，我无法选择合适的质量值。

还有其他方法可以解决这个问题吗？请帮助或尝试给出一些如何实现这一目标的想法。

python python-imaging-library

gue*_*bai

2018 03-06

6
推荐指数

1
解决办法

7300
查看次数