字数统计程序有什么问题？

ale*_*kuk 1 testing perl count cpu-word

我的测试中有一个问题:

计算文件中行数和单词数的程序有什么问题？

open F, $ARGV[0] || die $!;
my @lines = <F>;
my @words = map {split /\s/} @lines;
printf "%8d %8d\n", scalar(@lines), scalar(@words);
close(F);

Run Code Online (Sandbox Code Playgroud)

我的推测是:

如果文件不存在,程序将不会告诉我们.
如果文件中有标点符号,程序将对它们进行计数,例如,在
```
abc cba
, , ,dce
```
Run Code Online (Sandbox Code Playgroud)
将是五个字,但另一方面wc输出相同的结果,因此它可能被认为是正确的行为.
如果F是一个大文件,最好迭代线而不是将其转储到lines数组中.

你有什么不那么琐碎的想法吗？

在第一行,您有一个优先问题:

open F, $ARGV[0] || die $!;

Run Code Online (Sandbox Code Playgroud)

是相同的

open F, ($ARGV[0] || die $!);

Run Code Online (Sandbox Code Playgroud)

这意味着die如果文件名为false则执行,而不是open失败.你想说

open(F, $ARGV[0]) || die $!;

Run Code Online (Sandbox Code Playgroud)

要么

open F, $ARGV[0] or die $!;

Run Code Online (Sandbox Code Playgroud)

此外,您应该使用open的3参数形式,以防$ARGV[0]包含意味着什么的字符open.

open F, '<', $ARGV[0] or die $!;

Run Code Online (Sandbox Code Playgroud)

在另一个注释上,拆分/\s/意味着您在连续的空白字符之间得到一个"单词".您可能意味着/\s+/,或者作为amphetamachine建议,/\W+/取决于您想要如何定义"单词".

如果行以空格开头,那么仍然会出现空白"单词"的问题.您可以拆分' '以抑制它(这是一种特殊情况),或者您可以先修剪前导空格,或者插入一个grep { length $_ }清除空的"单词",或者放弃split并使用不同的方法来计算单词.

逐行处理而不是一次读取整个文件也是一个很好的改进,但它并不像前两个项目那么重要.

归档时间：	15 年，3 月前
查看次数：	424 次
最近记录：	15 年，3 月前

在centos上安装perl-JSON 13

以编程方式编辑Photoshop PSD文本图层 11

试图对TDD的好处充满信心 11

使用异步调用测试GWTP演示者 8

Facebook无法使用测试用户访问令牌在测试用户页面上发布视频 8

Cypress 组件测试在运行测试用例时不会加载 CSS 7

与perl 5.10.1一样,IPC :: Open3 :: open3()不能与perl 5.14.2一起使用吗？ 4

从Perl中的XML文件中提取一些元素值的最快方法是什么？ 3

如何在Grails webflow中测试flash.message？ 3

加特林：设置报告目录名称？ 3

使用jQuery禁用/启用输入？ 2216

CSS三角形如何工作？ 1791

Python join:为什么是string.join(list)而不是list.join(string)？ 1669

JavaScript中==和===之间的区别 1592

如何修复java.lang.UnsupportedClassVersionError:不支持的major.minor版本 1532

你什么时候使用git rebase而不是git merge？ 1461

传输安全性阻止了明文HTTP 1425

从JS数组中删除重复值 1225

sh和bash之间的区别 1194

Python中的null对象？ 1097