Mor*_*rin 2 regex windows dos findstr
我在 Windows dos 提示符下。我有日志文件,其中包含如下日志:
Timestamp: Order received for Item No. 26551
Timestamp: Exception: OutOfRangeException
Timestamp: Message: Inventory Item is not stock. Item No. 23423
Timestamp: Order received for Item No. 23341
Run Code Online (Sandbox Code Playgroud)
我想提取所有给出某种异常的项目编号。我为此使用 findstr 命令。如何在正则表达式中使用换行符?我想要所有有异常词的行以及从下一行开始的项目号。
有什么帮助吗?
我发现了一个未记录的功能 - FINDSTR可以匹配新行字符<CR>并<LF>在后续行上继续匹配。但搜索字符串必须在命令行上指定,换行符必须位于变量中,并且值必须通过延迟扩展传递。
另一个复杂之处是 FOR 循环的 IN() 子句在单独的隐式 CMD 会话中执行,并且必须重新启用延迟扩展。另外,!必须对字符进行转义,以便它们能够进入第二个 CMD 会话。
这个小测试脚本就可以解决这个问题。
@echo off
setlocal enableDelayedExpansion
if "%~1"==":doSearch" goto :doSearch
::Define a variable as a LineFeed (0x0A) character
set LF=^
:: The above 2 blank lines MUST be preserved!
::Define a CR variable as a CarriageReturn (0x0D) character
for /f %%a in ('copy /Z "%~dpf0" nul') do set "CR=%%a"
set file="test.txt"
for /f "delims=" %%A in ('cmd /v:on /c^"findstr /rc:"Item No\. .*^!CR^!*^!LF^!.* Exception: " %file%^"') do (
set "ln=%%A"
set "item=!ln:*Item No. =!"
echo Item No. !item! had an exception
)
exit /b
Run Code Online (Sandbox Code Playgroud)
编辑2015-01-11
我刚刚重读了这个问题,发现我错了。OP想要异常字符串出现在前一行的项目编号(后向搜索),但我的解决方案只能找到异常出现在后一行的项目编号(前瞻搜索)。
不幸的是,没有办法让 FINDSTR 进行搜索后面的查看。
在大多数情况下,我会删除上面的答案,因为它没有回答问题。然而,这个答案确实记录了一个以前没有描述过的新颖的 FINDSTR 功能,该功能可能非常有用。前瞻功能在概念上与后视功能足够接近,需要它的人可能会通过这个问题找到答案,所以我计划保留它。
我确实有一个纯粹基于脚本的解决方案,可以在 XP 及以上的任何 Windows 计算机上运行,但它不使用 FINDSTR。JREPL.BAT是一个正则表达式命令行,可以轻松提取所需的项目编号。
jrepl "Item No\. (\d+)\r\n.* Exception: " $1 /m /jmatch /f test.txt
Run Code Online (Sandbox Code Playgroud)