提升精神语法匹配嘈杂的输入

111*_*111 3 c++ boost boost-spirit boost-spirit-qi

我试图解析一个嘈杂的输入,理想情况下,我将能够看到一个节是否匹配规则,如果它确实得到我需要的数据并丢弃其余的.

我想要的数据如下.

Event: Newstate
Channel: SIP/104-000001bb
ChannelState: 6
ChannelStateDesc: Up
Run Code Online (Sandbox Code Playgroud)

我想确保事件是否为新状态.

我需要频道状态.其余的我不关心(刚才)所以我想忽略它,我希望它是灵活的,并接受重要的东西之间的任何旧垃圾,真的我不想说忽略这一行,而是忽略事件和信道状态结束之间的任何内容,我捕获值.

到目前为止我有:

typedef boost::fusion::vector2<std::string, std::string> vect;
qi::rule<std::string::iterator, vect(), space> rule_ =
            lit("Event: ")      >> *char_("a-zA-Z") >>  
            qi::omit[ *char_ ]  >>  
            "ChannelState: "    >> *char_("0-9")    >>  
            qi::omit[ *char_ ];
Run Code Online (Sandbox Code Playgroud)

但由于某种原因,这不起作用,当我这样做时,我总是会回复:

vect v;
bool r=qi::parse(it, str.end(), rule_, v); 
Run Code Online (Sandbox Code Playgroud)

编辑:Boost版本1.42编译器g ++ 4.4精神0x2020

Nic*_*las 6

记住:Spirit的解析器是贪婪的.这意味着如果你这样做qi::omit[ <something> ],它将继续省略字符,直到<something>不再符合.因为<something>字面上是任何东西(char_匹配任何字符,所以*char_匹配所有字符),它将吃掉字符串的其余部分.然后它会引发错误,因为它从未进入"ChannelState:".

你做这件事的方式根本行不通.你必须有一些切断开关来阻止*char_吃东西.

我不明白你为什么不把它们全部解析成一个std::map,而不是零碎地做.然后你可以挑选出你想要的元素.你说你还不想要一些元素,所以请忽略它们.

这将按如下方式完成:

//Includes
#include <boost/spirit/include/qi.hpp>
#include <boost/fusion/adapted/std_pair.hpp>

//Code
using namespace boost::spirit;
using ascii::char_;
using ascii::string;

qi::rule<std::string::iterator, std::pair<std::string, std::string>() > pair_rule =
  *(char_ - ':') >> ':' >>
  qi::omit[*ascii::space] >>
  *(char_ - eol) >> (eol || eoi);

qi::rule<std::string::iterator, std::map<std::string, std::string>() > map_rule =
  +pair_rule;

std::map<std::string, std::string> v;
bool r = qi::parse(test.begin(), test.end(), map_rule, v); 
Run Code Online (Sandbox Code Playgroud)

请注意,这适用于Boost 1.47.我怀疑它会在早期版本上失败.

Boost版本1.42编译器g ++ 4.4 Spirit 0x2020

那些相当古老.你应该考虑升级.Boost现在高达1.47.