我目前正在使用scikit-image库在python中处理图像处理.我正在尝试使用索沃拉阈值使用以下代码制作二进制图像:
from PIL import Image
import numpy
from skimage.color import rgb2gray
from skimage.filters import threshold_sauvola
im = Image.open("test.jpg")
pix = numpy.array(im)
img = rgb2gray(pix)
window_size = 25
thresh_sauvola = threshold_sauvola(img, window_size=window_size)
binary_sauvola = img > thresh_sauvola
Run Code Online (Sandbox Code Playgroud)
输出是一个numpy数组,此图像的数据类型是bool
[[ True True True ... True True True]
[ True True True ... True True True]
[ True True True ... True True True]
...
[ True True True ... True True True]
[ True True True ... True True True]
[ …Run Code Online (Sandbox Code Playgroud) python numpy image-processing python-imaging-library scikit-image
我目前正在用 C# 构建一个网络爬虫。为了对尚未爬网的 URL 进行排队,我使用 SQL Server。它工作得非常快,但随着时间的推移它开始变得非常大,这会减慢我的存储过程。
CREATE TABLE PriorityQueue
(
ID int IDENTITY(0,1) PRIMARY KEY,
absolute_url varchar (400),
depth int,
priorty int,
domain_host varchar (255),
);
CREATE INDEX queueItem ON PriorityQueue(absolute_url);
CREATE INDEX queueHost ON PriorityQueue(domain_host);
Run Code Online (Sandbox Code Playgroud)
这是我用于队列的表。优先级编号从 1 到 5,其中 1 是最高优先级。正如您所看到的,我还在下面的存储过程中使用了索引。
将新项目添加到队列的过程:
DROP PROCEDURE IF EXISTS dbo.Enqueue
GO
CREATE PROCEDURE dbo.Enqueue(@absolute_url varchar(255), @depth int, @priorty int, @host varchar(255))
AS
BEGIN
INSERT INTO [WebshopCrawler].[dbo].[PriorityQueue] (absolute_url, depth, priorty, domain_host) VALUES (@absolute_url, @depth, @priorty, @host);
END
GO
Run Code Online (Sandbox Code Playgroud)
获取最高优先级项目的过程:
DROP PROCEDURE IF …Run Code Online (Sandbox Code Playgroud) sql sql-server stored-procedures priority-queue query-performance