如何将Rayon与现有迭代器一起使用?

use*_*375 6 rust rayon

HashSet做了一些过滤之后把一个正则表达式变成了一个.我试图将它与Rayon一起使用,但是我无法弄清楚如何使Rayon与现有的迭代器一起工作而不将它首先转换为矢量.这可能吗?

let re = Regex::new("url=\"(?P<url>.+?)\"").unwrap();
let urls: HashSet<String> = re.captures_iter(&contents)
    .map(|m| Url::parse(m.name("url").unwrap().as_str()))
    .filter(|parsed_url| parsed_url.is_ok())
    .map(|parsed_url| parsed_url.unwrap())
    .filter(|parsed_url| parsed_url.has_host())
    .map(|parsed_url| parsed_url.into_string())
    .collect();
Run Code Online (Sandbox Code Playgroud)

Fre*_*ios 7

最小复制:

extern crate rayon;

use rayon::prelude::*;

fn main() {
    let v = vec![1_i32, 2, 3, 4].into_iter();

    // no method named `par_iter` found for type `std::vec::IntoIter<i32>`
    let _ = v.par_iter().sum();
}
Run Code Online (Sandbox Code Playgroud)

你不能这样做.以下是此功能的所有实现者,即:

  • 二叉堆
  • BTreeMap
  • BTreeSet
  • HashMap中
  • HashSet的
  • 链表
  • VecDeque
  • 选项
  • 范围
  • 结果
  • 片/阵列

我认为你无法并行化它们的原因是因为迭代器是懒惰的.迭代器基本上是当前项Option<Item>next()方法.您不能将它分成两部分来在不同的线程中执行它们.


Jes*_*ean 6

现在可以使用ParallelBridge

use rayon::iter::ParallelBridge;
use rayon::prelude::ParallelIterator;
use std::sync::mpsc::channel;

let rx = {
    let (tx, rx) = channel();

    tx.send("one!");
    tx.send("two!");
    tx.send("three!");

    rx
};

let mut output: Vec<&'static str> = rx.into_iter().par_bridge().collect();
output.sort_unstable();

assert_eq!(&*output, &["one!", "three!", "two!"]);
Run Code Online (Sandbox Code Playgroud)