gpt4 book ai didi

validation - 批量 UTF-8 验证工具?

转载 作者:行者123 更新时间:2023-12-01 23:26:20 25 4
gpt4 key购买 nike

有人知道我可以用来验证一堆 XML 文件是否支持 UTF-8 的应用程序/服务/方法吗?

基本上我有大量 XML 文件,它们被认为是 UTF-8,其中一些碰巧包含一些伪造的字符,导致它们无法在内容查看器中正确呈现。

我知道我可以使用以下答案中的方法一次检查一个:How to check whether a file is valid UTF-8?

...但是如果同时处理数千个 XML 文件呢?

最佳答案

为什么您不能从链接的问题中选择一种解决方案并将其应用于您的情况?遍历要检查的所有文件、对它们运行 iconv -f utf8 并发出失败的文件列表似乎相当简单。

更新
由于您没有具体说明您需要在什么情况下或环境下进行此测试,因此很难提供具体的建议。您链接的帖子提供了测试您想要的方法的方法,因此您只需要知道您有什么可用于实现解决方案。

假设一个基本的 *nix 环境,这个简单的 shell 脚本提供了一个基本的检查,警告典型的文件名通配问题。

#!/bin/sh
for f in *.xml; do
if ! iconv -f utf8 $f >/dev/null 2>&1; then
echo $f
fi
done

不过,除非您提供有关您的具体要求的更多信息,否则很难知道人们的任何答案是否真正相关。

关于validation - 批量 UTF-8 验证工具?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1828147/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com