我的正则表达并不像应该的那样好,我提前道歉.
码:
#!/usr/bin/perl -wT
use strict;
use warnings;
use Text::ParseWords;
my @AoH;
my $filename = 'metadata.txt';
open(my $fh, '<', $filename) or die "Could not open file '$filename' $!";
while (<$fh>) {
my $rec = {};
for my $field ( split ) {
(my $key, my $value) = quotewords('=', 0, $field);
$rec->{$key} = $value;
print "$key -> $value;\n";
}
push @AoH, $rec;
}
Run Code Online (Sandbox Code Playgroud)
我想解析以下字符串(位于metadata.txt中):
video_info ="这是视频说明"video_name ="avideoname.mp4"video_thumb ="avideothumbnail.jpg"
本质上,我想拆分前面提到的字符串,以便引号中的任何内容都是一个值(包括空格)以及=之前的任何内容都是键.
我想要的输出:
video_info -> This is a video description;
video_name -> avidenoname.mp4;
video_thumb -> avideothumbnail.jpg;
Run Code Online (Sandbox Code Playgroud)
我正在使用它作为创建我的哈希数组的参考:http://docstore.mik.ua/orelly/perl/prog3/ch09_03.htm //docstore.mik.ua/orelly/perl/prog3/ch09_03.htm,稍微修改代码(例如使用引号而不是拆分) .我觉得这主要是一个正则表达式问题,但如果有任何问题或使用不推荐的代码,请随时纠正/解释任何不一致.
任何帮助,将不胜感激.提前致谢.
split 不适合将由空格分隔的字符串拆分为两个也包含空格的子字符串.
例如,在您的情况下,split用于此行:
video_info="This is a video description" video_name="avideoname.mp4"
Run Code Online (Sandbox Code Playgroud)
将给出如下数组:
qw(video_info="This, is, a, video, description", video_name="avideoname.mp4")
Run Code Online (Sandbox Code Playgroud)
这绝对不是想要的输出.
相反,您可以使用quotewords拆分此行:
quotewords('\s+', 0, $_)
Run Code Online (Sandbox Code Playgroud)
会给:
qw(video_info="This is a video description", video_name="avideoname.mp4")
Run Code Online (Sandbox Code Playgroud)
此外,最好chomp在处理一行之前消除影响\n.
#!/usr/bin/perl -w
use strict;
use warnings;
use Text::ParseWords;
my @AoH;
my $filename = 'metadata.txt';
open(my $fh, '<', $filename) or die "Could not open file '$filename' $!";
while (<$fh>) {
chomp;
my $rec = {};
for my $field ( quotewords('\s+', 0, $_) ) {
(my $key, my $value) = quotewords('=', 0, $field);
$rec->{$key} = $value;
print "$key -> $value;\n";
}
push @AoH, $rec;
}
Run Code Online (Sandbox Code Playgroud)