gpt4 book ai didi

Java 无法比较 pdfbox 中的 ö(瑞典字符)

转载 作者:行者123 更新时间:2023-12-01 12:28:50 24 4
gpt4 key购买 nike

我使用 pdfbox 从 pdf 文件中获取数据我正在使用 selenium webdriver 将该数据与网页数据进行比较。我能够从两者获取数据。我使用 contains 方法来比较这两个数据。Java 能够比较 glädjande 类型的数据,但是当 Kommunstyrelsens ordförande 在句子中用作时,它无法匹配。但是 ordförande 作为单个单词是可以匹配的。我也尝试过

PDFTextStripper pdfStripper = new PDFTextStripper("ISO8859_1");

但无法使用 contains 方法匹配数据。

最佳答案

使用java的collat​​er类来更改语言环境并比较非英语字符串和字符。

import java.text.Collator;
import java.util.Locale;

public class CollatorExp {

public static void main(String[] args) {
Collator collator = Collator.getInstance(Locale.FRENCH);
collator.setStrength(Collator.PRIMARY);

if (collator.compare("xéáuér", "xéáuér") == 0) {
System.out.println("Equal");
} else {
System.out.println("Not Equal");
}
}
}

关于Java 无法比较 pdfbox 中的 ö(瑞典字符),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26113553/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com