如何循环std :: regex_search的结果?

Nop*_*Nop 10 c++ regex stl c++11

在调用之后std::regex_search,我只能从std::smatch某些原因得到第一个字符串结果:

Expression.assign("rel=\"nofollow\">(.*?)</a>");
if (std::regex_search(Tables, Match, Expression))
{
    for (std::size_t i = 1; i < Match.size(); ++i)
        std::cout << Match[i].str() << std::endl;
}
Run Code Online (Sandbox Code Playgroud)

所以我尝试用另一种方式 - 用迭代器:

const std::sregex_token_iterator End;
Expression.assign("rel=\"nofollow\">(.*?)</a>");
for (std::sregex_token_iterator i(Tables.begin(), Tables.end(), Expression); i != End; ++i)
{
    std::cout << *i << std::endl;
}
Run Code Online (Sandbox Code Playgroud)

这确实贯穿了每一场比赛,但它也给了我整个匹配的字符串,而不仅仅是我之后的捕获.当然必须是另一种方式,而不是必须std::regex_search在循环中的迭代器元素上做另一个?

提前致谢.

Joh*_*esD 9

regex_token_iterator采用可选的第四个参数,指定每次迭代返回哪个子匹配.此参数的默认值为0,在C++(以及许多其他)正则表达式的情况下,表示"整个匹配".如果要获取第一个捕获的子匹配,只需将1传递给构造函数:

const std::sregex_iterator End;
Expression.assign("rel=\"nofollow\">(.*?)</a>");
for (std::sregex_token_iterator i(Tables.begin(), Tables.end(), Expression, 1); i != End; ++i)
{
    std::cout << *i << std::endl; // *i only yields the captured part
}
Run Code Online (Sandbox Code Playgroud)

  • 当然,你是对的,我并不打算以任何方式批评你的回答.这只是观察人们如何创建(非标准)东西,让你编写代码,如`for(auto i:range(10))`.我相信有这样的适配器用于正则表达式会使它们更具可读性,而且我认为使用一些升压适配器是可能的.如果他们在某些时候被纳入stdlib,我当然不会抱怨. (2认同)

Die*_*lla 5

std::regex_search只搜索一次正则表达式.它不返回匹配列表,而是返回子匹配表达式列表(括号内的表达式).这就是为什么你只得到一个Match[1],链接标签内的文本.

至于第二个代码,它实际上会返回所有匹配项,但它会再次返回match_results对象,因此您必须使用[]运算符:

const std::sregex_iterator End;
Expression.assign("rel=\"nofollow\">(.*?)</a>");
for (std::sregex_iterator i(Tables.begin(), Tables.end(), Expression); i != End; ++i)
{
    std::cout << (*i)[1] << std::endl; // first submatch, same as above.
}
Run Code Online (Sandbox Code Playgroud)