我有一个包含以下数据的 csv:
0,M,19,finnish,english swedish german
9,M,30,urdu,english
122,F,26,finnish,english swedish german
83,M,20,finnish,english french swedish
44,F,20,finnish,english swedish
10,F,29,finnish,english
Run Code Online (Sandbox Code Playgroud)
我需要一个使用 GREP 的过滤器,而不是取大于 10 且小于 99 的用户值(第一列)。
这是我最好的动作:
cat demographic_info.csv | grep -e "1[0-9]*"
Run Code Online (Sandbox Code Playgroud)
假设您想要完全匹配从10到 的数字99(即11包含98到),您可以使用
grep -E '^(1[1-9]|[2-8][0-9]|9[0-8]),' file
Run Code Online (Sandbox Code Playgroud)
数字范围模式是在如何使用正则表达式匹配 X 和 Y 之间的数字?,我只需要删除?:,因为 POSIX ERE 不支持非捕获组。
然而,
awk -F\, '$1 < 99 && $1 > 10' file
Run Code Online (Sandbox Code Playgroud)
看起来更适合这项任务。它使用逗号作为字段分隔符,并检查第一个字段值是否小于 99 且大于 10,并仅输出这些行。
查看在线演示:
#!/bin/bash
s='0,M,19,finnish,english swedish german
9,M,30,urdu,english
122,F,26,finnish,english swedish german
83,M,20,finnish,english french swedish
44,F,20,finnish,english swedish
10,F,29,finnish,english'
awk -F\, '$1 < 99 && $1 > 10' <<< "$s"
echo "---"
grep -E '^(1[1-9]|[2-8][0-9]|9[0-8]),' <<< "$s"
Run Code Online (Sandbox Code Playgroud)
输出:
83,M,20,finnish,english french swedish
44,F,20,finnish,english swedish
---
83,M,20,finnish,english french swedish
44,F,20,finnish,english swedish
Run Code Online (Sandbox Code Playgroud)