小编ett*_*ore的帖子

只提取汉字

我正在处理用意大利语和中文编写的文本,我只需要使用AWK. 我怎样才能做到这一点?

我试过:

[中文Unicode字符的范围是4E00 thru 9FFF (344 270 200 thru 351 277 277)这样测试应该是>"\343" and <"\352"(为了避免拿起任何4个字符的UTF-8代码)]:

{
f=0;
for ( i=1; i<=length; i++)
if(substr($0, i, 1)>"\343" &&substr($0, i, 1)<"\352")
f = 1 

print $f
}
Run Code Online (Sandbox Code Playgroud)

但是有一个错误或更多错误。我找不到它/他们

awk text-processing unicode

6
推荐指数
2
解决办法
3276
查看次数

标签 统计

awk ×1

text-processing ×1

unicode ×1