gpt4 book ai didi

java - Java 如何高效替换 XML 文档中的字符?

转载 作者:数据小太阳 更新时间:2023-10-29 02:32:41 26 4
gpt4 key购买 nike

我正在寻找一种简洁高效的方法来替换 XML 文档中的字符。有一个为近 12.000 个 UTF-8 字符定义的替换表,其中大部分要用单个字符替换,但有些必须用两个甚至三个字符替换(例如希腊语 theta 应该变成 TH)。这些文档可能很大 (100MB+)。如何在Java中做到这一点?我想到了使用 XSLT,但我不太确定这是否是最佳选择。

最佳答案

根据我的经验,String.replace(..) 非常慢。我曾经使用该 API 解析 100MB KML 文件,但性能很差。然后,我使用 Pattern.compile(..) 预编译了正则表达式,并且速度更快。

关于java - Java 如何高效替换 XML 文档中的字符?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2865634/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com