如何让grep [AZ]独立于语言环境?

Ren*_*soo 7 grep locale

我正在做一些日常的捣蛋,突然发现看似微不足道的东西不起作用:

$ echo T | grep [A-Z]
Run Code Online (Sandbox Code Playgroud)

没有比赛.

为什么T不在AZ范围内?

我改变了正则表达式:

$ echo T | grep [A-Y]
Run Code Online (Sandbox Code Playgroud)

一场比赛!

哇!如何在AY内,但不在AZ内?

显然这是因为我的环境设置为爱沙尼亚语区域,其中Y位于字母表的末尾,但Z位于中间位置:ABCDEFGHIJKLMNOPQRSŠZŽTUVWÕÄÖÜXY

$ echo $LANG
et_EE.UTF-8
Run Code Online (Sandbox Code Playgroud)

这对我来说有点震惊.99%的时候我会用计算机代码,而不是爱沙尼亚文学.我一直在以错误的方式使用grep吗?我过去因此犯过什么样的错误?

在尝试了几件事后,我得出了以下解决方案:

$ echo T | LANG=C grep [A-Z]
Run Code Online (Sandbox Code Playgroud)

这是使grep语言环境独立的推荐方法吗?

更多......定义这样的别名是安全的:

$ alias grep="LANG=C grep"
Run Code Online (Sandbox Code Playgroud)

PS.我也想知道为什么字符范围[A-Z]首先依赖于语言环境,而且\w似乎不受语言环境的影响(尽管手册中说\w的相当于[[:alnum:]]- 但我发现后者依赖于语言环境而\w不是语境环境).

Gil*_*ert 5

POSIX正则表达式,Linux和FreeBSD grep支持自然,以及其他一些支持请求,有一系列[:xxx:]模式,以支持语言环境.有关详细信息,请参见手册页.

   grep '[[:upper:]]' 

由于[] s是模式名称的一部分,因此无论外观多么奇怪,您都需要外部[].

随着这些代码的出现:经典\ w等代码严格保留在C语言环境中.因此,您选择的模式可确定grep是否使用当前区域设置.

[AZ]应该遵循区域设置,但您可能需要设置LC_ALL而不是LANG,尤其是当系统将LC_ALL设置为不同的值时.