在Perl正则表达式中嵌入评估

Zac*_*h H 8 regex perl

所以我正在编写一个快速的perl脚本来清​​理一些HTML代码并通过html - > pdf程序运行它.我希望尽可能少地丢失信息,所以我想扩展我的textareas以适应当前所有的文本.这意味着,在我的情况下,根据文本框内的字符串值将行数设置为计算值.

这是我正在使用的正则表达式

$file=~s/<textarea rows="(.+?)"(.*?)>(.*?)<\/textarea>/<textarea rows="(?{ length($3)/80 })"$2>$3<\/textarea>/gis;
Run Code Online (Sandbox Code Playgroud)

不幸的是,Perl似乎没有意识到我被告知的是在搜索和替换正则表达式中嵌入Perl代码的语法是否有任何Perl迷们愿意告诉我我做错了什么?此致,扎克

Gre*_*con 11

(?{...})模式是在匹配端执行代码的实验性功能,但您希望在替换端执行代码.使用/eregular-expression开关:

#! /usr/bin/perl

use warnings;
use strict;

use POSIX qw/ ceil /;

while (<DATA>) {
  s[<textarea rows="(.+?)"(.*?)>(.*?)</textarea>] {
    my $rows = ceil(length($3) / 80);
    qq[<textarea rows="$rows"$2>$3</textarea>];
  }egis;
  print;
}

__DATA__
<textarea rows="123" bar="baz">howdy</textarea>
Run Code Online (Sandbox Code Playgroud)

输出:

<textarea rows="1" bar="baz">howdy</textarea>

  • @Hi-Angel 是的,它确实使用 /e 选项...“egis”打开 e、g、i 和 s 标志。而且OP并没有要求单行...Greg提供了一个可以运行的可读的完整perl脚本...他可以像原来那样将模式匹配压缩到一行,但这将使其变得毫无意义很难明白。 (2认同)

Eri*_*rom 6

用于嵌入代码的语法仅在替换的"匹配"部分(左侧)有效.要在右侧嵌入代码(这是一个普通的Perl双引号字符串),您可以这样做:

$file =~ s{<textarea rows="(.+?)"(.*?)>(.*?)</textarea>}
          {<textarea rows="@{[ length($3)/80 ]}"$2>$3</textarea>}gis;
Run Code Online (Sandbox Code Playgroud)

这使用了Perl的习语"some string @{[ embedded_perl_code() ]} more string".

但是如果你正在处理一个非常复杂的语句,那么将替换置于"eval"模式可能会更容易,它将替换字符串视为Perl代码:

$file =~ s{<textarea rows="(.+?)"(.*?)>(.*?)</textarea>}
          {'<textarea rows="' . (length($3)/80) . qq{"$2>$3</textarea>}}gise;
Run Code Online (Sandbox Code Playgroud)

请注意,在两个示例中,正则表达式的结构都是s{}{}.这不仅消除了逃避斜线的需要,而且还允许您将表达式分布在多行上以便于阅读.