我在 hdfs 中有一个提要。
我必须找到第三列不为空的行。
饲料被分隔符分隔 |
SQL 等价物
select * from feed_table where column_3 is not null;
Run Code Online (Sandbox Code Playgroud)
输入:
1|abc|123
2|def|
3|ff|124
4|gh|
Run Code Online (Sandbox Code Playgroud)
输出:这里的第三列不为空。
1|abc|123
3|ff|124
Run Code Online (Sandbox Code Playgroud)
您可以awk用于此任务。将 awk 中的分隔符设置为|,然后检查第 3 列是否不是空字符串。
$ cat /tmp/foo
1|abc|123
2|def|
3|ff|124
4|gh|
$ awk -F'|' '$3 != ""' /tmp/foo
1|abc|123
3|ff|124
Run Code Online (Sandbox Code Playgroud)