我正在尝试设计Perl regex来解析来自IBM的runmqsc实用程序的命令输出.
感兴趣的每行输出包含一个或多个属性/值对,格式为:"ATTRIBUTE(VALUE)".属性的值可以为空,也可以包含括号本身.通常,给定行上最多出现两个属性/值对,因此正则表达式是在此假设下编写的.
Perl RE的示例输入:
CHANNEL(TO.IPTWX01) CHLTYPE(CLUSRCVR)
DISCINT(6000) SHORTRTY(10)
TRPTYPE(TCP) DESCR( )
LONGTMR(1200) SCYEXIT( )
CONNAME(NODE(1414)) MREXIT( )
MREXIT( ) CONNAME2(SOME(1416))
TPNAME( ) BATCHSZ(50)
MCANAME( ) MODENAME( )
ALTTIME(00.41.56) SSLPEER()
CONTRIVED() ATTR (00-41-56)
CONTRIVED() DOCTORED()
MSGEXIT( )
Run Code Online (Sandbox Code Playgroud)
我有以下Perl代码来捕获每个属性/值对.
my $resplit = qr/\s+([^\s]+(?:\([^)]*\))?)\s?/;
while ( <IN2> )
{ s/[\s\r\n]+$//;
if ( m/^\s(?:$resplit)(?:$resplit)?$/ )
{ my ($one,$two) = ($1,$2);
print "one: $one, two: $two\n";
}
}
Run Code Online (Sandbox Code Playgroud)
以上代码应用于示例输入时的输出:
one: CHANNEL(TO.IPTWX01), two: CHLTYPE(CLUSRCVR) one: DISCINT(6000), two: SHORTRTY(10) one: TRPTYPE(TCP), two: DESCR( ) one: LONGTMR(1200), two: SCYEXIT( ) one: CONNAME(NODE(1414)), two: MREXIT( ) one: MREXIT( ), two: CONNAME2(SOME(1416)) one: TPNAME( ), two: BATCHSZ(50) one: MCANAME( ), two: MODENAME( ) one: ALTTIME(00.41.56), two: SSLPEER() one: CONTRIVED(), two: ATTR(00-41-56) one: CONTRIVED(), two: DOCTORED() one: MSGEXIT(, two: )
除了上面输出中的最后一行之外,这种方法很有用.我真的很难弄清楚如何修改上面的表达式$ resplit来捕获最后一种情况.
任何人都可以提供有关如何使这项工作或其他方法的任何想法/建议?
该文本::平衡模块被设计用来处理这类问题.这种方法也可以处理任意数量的列.
use strict;
use warnings;
use Text::Balanced qw(extract_bracketed);
my ($extracted, $remainder, $prefix);
while ( defined($remainder = <DATA>) ){
while ( Get_paren_text() ){
$prefix =~ s/ //g;
print $prefix, $extracted, "\n";
}
}
sub Get_paren_text {
($extracted, $remainder, $prefix)
= extract_bracketed($remainder, '()', '[\w ]+');
return defined $extracted;
}
__DATA__
CHANNEL(TO.IPTWX01) CHLTYPE(CLUSRCVR) FOO( ( BAR) )
DISCINT(6000) SHORTRTY(10) BIZZ((((BUZZ) ) ) ) )
TRPTYPE(TCP) DESCR( )
LONGTMR(1200) SCYEXIT( )
CONNAME(NODE(1414)) MREXIT( )
MREXIT( ) CONNAME2(SOME(1416))
TPNAME( ) BATCHSZ(50)
MCANAME( ) MODENAME( )
ALTTIME(00.41.56) SSLPEER()
CONTRIVED() ATTR (00-41-56)
CONTRIVED() DOCTORED()
MSGEXIT( )
Run Code Online (Sandbox Code Playgroud)