如何在Perl中读取ISO 8859-1(Latin-1)编码文本

Joh*_*ery 7 perl encoding input latin1

所以我正在尝试编写一个perl脚本来读取一个用Latin-1编码的文件.由于某种原因,这只是没有成功.当我尝试简单搜索我知道的文件中的字符时(它在第一行),没有任何显示.我正在使用编码"iso 8859-1"; 下面,但我也尝试过binmode(STDIN,":utf8"); .关于我可能做错了什么以及如何做对的任何建议?

use encoding "iso 8859-1";

while(<>)
{
    if(/ó/gi)
    {
    print "Found one!\n";
    }
}
Run Code Online (Sandbox Code Playgroud)

tch*_*ist 16

不要使用use encodingpragma:它已经坏了.

在此处指定编码:

use open ":encoding(Latin1)";
Run Code Online (Sandbox Code Playgroud)

或者把它放在开放的地方:

open(FH, "< :encoding(Latin1)", $pathname)
   || die "can't open $pathname: $!";
Run Code Online (Sandbox Code Playgroud)

binmode打开后:

binmode(FH, ":encoding(Latin1)")
   || die "can't binmode to encoding Latin1";
Run Code Online (Sandbox Code Playgroud)

如果你正在使用<ARGV>,那么use open可能是最简单的.

不要忘记在输出流上设置编码.

  • 另一个问题是脚本的编码是什么,因为它使用ó作为文字字符. (2认同)