dva*_*erl 2 regex xml biztalk edi
我需要验证BizTalk架构中的元素中的日期范围.我收到了结束日期之前的开始日期(20130521-20130501).我知道我可以在地图中使用XSLT和C#轻松解析和验证此字符串,但是,我需要将验证作为模式的一部分,以便在收到具有此格式日期的事务时,BizTalk将拒绝EDI事务并向发件人发回999拒绝.
我已经阅读了许多帖子,建议不要使用正则表达式验证日期范围,但除了创建自定义管道组件或使用C#,我没有看到任何其他方式.有一个schema属性允许使用正则表达式来验证输入数据.
我对正则表达式不太满意,需要一些帮助来确定如何验证开始日期是否小于或等于结束日期.日期以字符串形式接收.我已经阅读过关于在" - "上拆分字符串的内容,但不知道如何比较结果.任何帮助,将不胜感激.
免责声明:我正在使用PHP,这意味着我正在使用PCRE正则表达式.
您似乎并不知道正则表达式的限制,但这没关系.
真正的问题是以下解决方案:检查是否x =< y匹配.
为什么?那么你想检查一下start date =< end date.正则表达式的想法是匹配某个常规模式之后的某些字符.单独的正则表达式无法检查是否x < y因为正则表达式没有逻辑运算符> <.
正则表达式可以做的是检查是否x = y.比方说,我有以下字符串,我想得到所有行x = y:
10 = 10
15 = 51
33 = 31
100 = 101
780 = 780
Run Code Online (Sandbox Code Playgroud)
我们可以使用以下正则表达式:^(\d+)\s*=\s*\1$使用m修饰符.这是什么意思 ?
^ :开始行(\d+) :分组并匹配任何数字一次或多次\s*=\s*:匹配空格0次或更多次,然后=再任何空格0次或更多次\1 :引用第1组,因此只有在与第1组匹配的内容相同时才匹配.$ : 行结束m修饰符:多行.分别制作^和$匹配开始和结束
让我们进一步深入了解.对于这个POC,我们将匹配以下内容:x-ywhere 0 =< x =< 9和0 =< y =< 9and x =< y.
我们可以做的是尝试匹配所有可能的地方x =< y.所以,如果x=0那时y=[0-9],如果x=1那时y=[1-9],如果x=2那么y=[2-9]等等.由于正则表达式有or声明,我们可以写下面的正则表达式:
0-[0-9]|1-[1-9]|2-[2-9]|3-[3-9]|4-[4-9]|5-[5-9]|6-[6-9]|7-[7-9]|8-[8-9]|9-9
在线演示
你看到了吗?实际上,进行简单的比较需要很长时间!这就是为什么任何理智的人都会使用内置语言工具解析和验证它.
我们将使用PHP生成一个正则表达式:
$start = strtotime('2013-01-01'); // Start date
$end = strtotime('2013-03-01'); // End date
$range = array_map(function($v){return date('Ymd', $v);}, range($start, $end, 86400)); // Creating the range of dates
$result = ''; // Declaring an empty variable to store our regex in it
for($i=$start;$i<=$end;$i+=86400){ // loop each day
$result .= '(?:' . date('Ymd', $i) . '-(?:'. implode('|', $range) . '))|'; // building our regex
array_shift($range); // removing first element of range
}
$result = substr($result, 0, -1); // removing last | since we don't need it
echo $result; // Output
Run Code Online (Sandbox Code Playgroud)
上面的代码将产生一个正则表达式可以验证之间的日期2013-01-01和2013-03-01其中x =< y的形式x-y.此正则表达式未优化,大约17KB.如果我将其配置为验证10年的范围,那么想象一下这个正则表达式的大小?请注意,大小呈指数级增长.我尝试了4个月的间隔,但是我得到一个错误/警告说表达式太长了.
由于正则表达式太长,我无法进行在线演示,但这里是PHP中的代码:
$string = '20130101-20130101
20130201-20130101
20130105-20130120
20130201-20130301
20130210-20130215
20130301-20130301
20130301-20130201
'; // A sample
$regex = file_get_contents('regex.txt'); // Get the regex from a file (which we generated previously)
preg_match_all('#'.$regex.'#', $string, $matches); // Let's regex !
print_r($matches[0]); // Printing the matches ...
Run Code Online (Sandbox Code Playgroud)
输出:
Array
(
[0] => 20130101-20130101
[1] => 20130105-20130120
[2] => 20130201-20130301
[3] => 20130210-20130215
[4] => 20130301-20130301
)
Run Code Online (Sandbox Code Playgroud)
请不要考虑使用正则表达式来完成这项任务,否则你会遇到10个问题:)
| 归档时间: |
|
| 查看次数: |
548 次 |
| 最近记录: |