相关疑难解决方法(0)

计算文本文件中单词的出现次数

我有一个包含推文的文本文件,我需要计算推文中提到某个词的次数。例如,该文件包含:

Apple iPhone X is going to worth a fortune
The iPhone X is Apple's latest flagship iPhone. How will it pit against it's competitors?
Run Code Online (Sandbox Code Playgroud)

假设我想计算文件中提到 iPhone 的次数。所以这就是我尝试过的。

cut -f 1 Tweet_Data | grep -i "iPhone" | wc -l
Run Code Online (Sandbox Code Playgroud)

它当然有效,但我对 unix 中的“wc”命令感到困惑。如果我尝试以下操作有什么区别:

cut -f 1 Tweet_Data | grep -c "iPhone"
Run Code Online (Sandbox Code Playgroud)

在哪里使用 -c 代替?这两者在一个充满推文的大文件中产生不同的结果,我对它的工作原理感到困惑。哪种方法是计算发生次数的正确方法?

grep text-processing cut

51
推荐指数
2
解决办法
17万
查看次数

以更少的方式计算匹配的数量

在 中less,有没有一种方法或技巧可以快速计算匹配的数量,而不是重复按 N 并手动计算匹配?

less

3
推荐指数
2
解决办法
1587
查看次数

验证 /etc/passwd 每行的字段数是否正确?

我正在寻找一种简单、便携的方法来验证 /etc/passwd、/etc/shadow、/etc/group 和 /etc/master.passwd 中的字段数量。这将在 FreeBSD、Linux 和其他 Un*xes 上运行。pwck 可以做到这一点,但它只能在基于 Linux 的系统上运行。

如何计算 /etc/passwd 中以冒号分隔的字段数?

root:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
Run Code Online (Sandbox Code Playgroud)

按照“ grep:计数总出现次数”中的示例,我想出了以下快速技巧:

cat /etc/passwd | while read LINE; do echo $LINE | grep -o ':'  |wc -l; done
Run Code Online (Sandbox Code Playgroud)

但我正在寻找更好的方法。

users text-processing

2
推荐指数
1
解决办法
763
查看次数

标签 统计

text-processing ×2

cut ×1

grep ×1

less ×1

users ×1