我正在写一些东西来从亚马逊提取产品数据,但我不确定如何规范 HTML 中的空白。
fn parse_html(html: std::string::String) {
let fragment = Html::parse_fragment(&html);
let product_title = Selector::parse(".s-line-clamp-2").unwrap();
for title in fragment.select(&product_title) {
let title_txt = title.text().collect::<Vec<_>>();
println!("{:?}", title_txt);
}
}
Run Code Online (Sandbox Code Playgroud)
这可行,但我得到的数据是这样的["\n \n \n \n\n\n\n\n", "\n \n \n \n ", "Men\'s Sneakers", "\n \n \n \n \n", "\n\n \n"]
我只想要这个:["Men\'s Sneakers"]
我对 Rust 很陌生,我想编写一个脚本来抓取页面并从中提取所有带有标题的链接。我什至没有提出 get 请求。:(
fn main() {
println!("Started!");
let body = reqwest::get("https://news.ycombinator.com")
.await?
.text()
.await?;
println!("body = {:?}", body);
}
Run Code Online (Sandbox Code Playgroud)
我显然没有返回任何东西但是我对语法感到困惑有人可以解释吗?运营商,并帮助我解决这个问题。