偶然地,我发现这wc
取决于它如何从 bash 获取输入的不同:
$ s='hello'
$ wc -m <<<"$s"
6
$ wc -c <<<"$s"
6
$ printf '%s' "$s" | wc -m
5
$ printf '%s' "$s" | wc -c
5
Run Code Online (Sandbox Code Playgroud)
这是 - 恕我直言令人困惑 - 行为记录在某处吗?wc
这里算什么- 这是一个假定的换行符吗?
假设,有一个简单的测试 PHP 脚本:
<?php
$a = ($argc == 2 ? $argv[1] : 10);
for ($i = 0; $i < $a; $i++) {
echo '.';
}
echo PHP_EOL;
Run Code Online (Sandbox Code Playgroud)
现在,我对文件执行 grep 或有条件的 sed:
grep '<' test.php
Run Code Online (Sandbox Code Playgroud)
产生包含<
. 这很清楚。
grep '\?' test.php
Run Code Online (Sandbox Code Playgroud)
产生包含问号的两行。这很清楚。
grep '<\?' test.php
Run Code Online (Sandbox Code Playgroud)
返回所有行 - 为什么?我希望它只输出第一行。但也许,<
应该被转义,这会产生另一个意想不到的输出。
sed -n '/pattern/p' test.php
Run Code Online (Sandbox Code Playgroud)
产生相同的结果。
我试图在https://regex101.com/上得到答案,但令我惊讶的是,该网站显示了我的期望。此外,一个快速而肮脏的 PHP 实现grep
产生了我所期望的:
<?php
if (($fh = fopen($argv[2], 'r')) !== false) {
while ($line = fgets($fh)) {
if (mb_ereg($argv[1], $line) !== …
Run Code Online (Sandbox Code Playgroud)