小编R.h*_*ens的帖子

python中的二值图像去噪

对于我的项目,我正在尝试使用 python 中的 openCV 对图像进行二值化。我使用 openCV 的自适应高斯阈值来转换图像,结果如下: 在此输入图像描述

我想使用二进制图像进行 OCR,但它的噪音太大。有什么方法可以去除Python中的二值图像中的噪声吗?我已经尝试过 openCV 的 fastNlMeansDenoising 但它没有什么区别。

PS 也欢迎更好的二值化选项

python opencv image-processing image-thresholding

5
推荐指数
1
解决办法
1万
查看次数

将boolean numpy数组转换为枕头图像

我目前正在使用scikit-image库在python中处理图像处理.我正在尝试使用索沃拉阈值使用以下代码制作二进制图像:

from PIL import Image
import numpy
from skimage.color import rgb2gray
from skimage.filters import threshold_sauvola

im = Image.open("test.jpg")
pix = numpy.array(im)
img = rgb2gray(pix)

window_size = 25
thresh_sauvola = threshold_sauvola(img, window_size=window_size)
binary_sauvola = img > thresh_sauvola
Run Code Online (Sandbox Code Playgroud)

这给出了以下结果: 在此输入图像描述

输出是一个numpy数组,此图像的数据类型是bool

[[ True  True  True ...  True  True  True]
 [ True  True  True ...  True  True  True]
 [ True  True  True ...  True  True  True]
 ...
 [ True  True  True ...  True  True  True]
 [ True  True  True ...  True  True  True]
 [ …
Run Code Online (Sandbox Code Playgroud)

python numpy image-processing python-imaging-library scikit-image

5
推荐指数
1
解决办法
2018
查看次数

SQL Server 中的优先级队列

我目前正在用 C# 构建一个网络爬虫。为了对尚未爬网的 URL 进行排队,我使用 SQL Server。它工作得非常快,但随着时间的推移它开始变得非常大,这会减慢我的存储过程。

CREATE TABLE PriorityQueue
(
ID int IDENTITY(0,1) PRIMARY KEY,
absolute_url varchar (400),
depth int,
priorty int,
domain_host varchar (255),
);

CREATE INDEX queueItem ON PriorityQueue(absolute_url);
CREATE INDEX queueHost ON PriorityQueue(domain_host);
Run Code Online (Sandbox Code Playgroud)

这是我用于队列的表。优先级编号从 1 到 5,其中 1 是最高优先级。正如您所看到的,我还在下面的存储过程中使用了索引。

将新项目添加到队列的过程:

DROP PROCEDURE IF EXISTS dbo.Enqueue
GO
CREATE PROCEDURE dbo.Enqueue(@absolute_url varchar(255), @depth int, @priorty int, @host varchar(255))
AS
BEGIN
    INSERT INTO [WebshopCrawler].[dbo].[PriorityQueue] (absolute_url, depth, priorty, domain_host) VALUES (@absolute_url, @depth, @priorty, @host);
END
GO
Run Code Online (Sandbox Code Playgroud)

获取最高优先级项目的过程:

DROP PROCEDURE IF …
Run Code Online (Sandbox Code Playgroud)

sql sql-server stored-procedures priority-queue query-performance

4
推荐指数
1
解决办法
2473
查看次数