小编use*_*333的帖子

使用未知大小的队列的Web爬网程序的生产者/使用者

我需要抓取父网页及其子网页,我从http://www.albahari.com/threading/part4.aspx#%5FWait%5Fand%5FPulse跟踪生产者/消费者概念.另外,我使用5个线程将​​链接排队和出列.

有关如何在队列长度未知的情况下,如果所有线程都已完成处理队列,我将如何结束/加入所有线程?

以下是关于我如何编码的想法.

static void Main(string[] args)
{
    //enqueue parent links here
    ...
    //then start crawling via threading
    ...
}

public void Crawl()
{
   //dequeue
   //get child links
   //enqueue child links
}
Run Code Online (Sandbox Code Playgroud)

c# queue multithreading web-crawler producer-consumer

5
推荐指数
1
解决办法
721
查看次数