gpt4 book ai didi

java - 我想使用 pdfbox 显示 pdf 中的阿拉伯语文本?

转载 作者:塔克拉玛干 更新时间:2023-11-02 07:53:36 27 4
gpt4 key购买 nike

它显示字母,但以阿拉伯语的相反顺序我使用以下代码

  PDDocument pddDocument = PDDocument.load(new File("test1.pdf"));
PDFTextStripper textStripper = new PDFTextStripper();

TextNormalize normalize = new TextNormalize("UTF-8");
String Text = textStripper.getText(pddDocument);

Text=normalize.makeLineLogicalOrder(Text, true);
Text = normalize.normalizePres(Text);
Text = normalize.normalizeDiac(Text);
System.out.println(Text);

最佳答案

http://site.icu-project.org/download/49#TOC-ICU4J-Download 下载 icu4j-49_1.jar 解决了问题放在类路径中

然后重写代码如下

PDDocument pddDocument = PDDocument.load(new File("test1.pdf"));
PDFTextStripper textStripper = new PDFTextStripper();
String Text = textStripper.getText(pddDocument);
System.out.println(Text);

关于java - 我想使用 pdfbox 显示 pdf 中的阿拉伯语文本?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/10778550/

27 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com