批量UTF-8验证工具?

Met*_*uru 3 validation batch-file utf-8

有人知道我可以用来验证UTF-8的一堆XML文件的app/service /方法吗?

基本上我有大量的XML文件,假设是UTF-8,其中一些碰巧包含一些虚假的字符,导致它们无法在内容查看器中呈现.

我知道我可以用这个答案中找到的方法一次检查一个:如何检查文件是否有效UTF-8?

...但是一次成千上万的XML文件怎么样?

jam*_*san 5

为什么不能从相关问题中选择一种解决方案并将其应用到您的情况中?看起来迭代你要检查的所有文件,iconv -f utf8在它们上运行并发出失败的文件列表似乎相当简单.

更新
由于您尚未指定需要执行此测试的情况或环境,因此很难提供具体建议.您链接的帖子提供了测试所需内容的方法,因此只需知道您可以使用哪些方法来实施解决方案.

假设一个基本的*nix环境,这个简单的shell脚本提供了一个基本的检查,告诫典型的文件名通配问题.

#!/bin/sh
for f in *.xml; do
    if ! iconv -f utf8 $f >/dev/null 2>&1; then
        echo $f
    fi
done
Run Code Online (Sandbox Code Playgroud)

除非您提供有关您的具体要求的更多信息,否则很难知道人们的任何答案是否真正相关.