Wal*_*chi 7 non-ascii-characters
可能重复:
如何grep UNIX中的非ASCII字符
我正在努力寻找一个如何在一个非常大的xml数据文件中找到非ascii字符的答案.我不想转换非ascii字符,我只想确定字符所在的数据文件中的位置,以便我可以通知源删除该值.非ascii数据(似乎是单个字符)导致我的处理程序失败.不幸的是,错误数据无法帮助我确定有问题的字符在文件中的位置.此XML数据文件包含数据记录,很可能位于描述字段或名称字段中.
我曾尝试使用文本工具,但它是一个如此庞大的文件(> 32MB)的文本,它是压倒性的.有没有办法在像PSPad或TextPad这样的工具中运行REGEX来查找7-BIT ASCII字符集之外的任何字符?