gpt4 book ai didi

c# - 每行阅读 PDF

转载 作者:太空狗 更新时间:2023-10-29 22:16:55 24 4
gpt4 key购买 nike

如何使用 iText5 for .NET 阅读 PDF 文件逐行?我通过互联网搜索,但我只找到每页内容的阅读 PDF 文件。

请看下面的代码。

public string ReadPdfFile(object Filename)
{

string strText = string.Empty;
try
{
PdfReader reader = new PdfReader((string)Filename);

for (int page = 1; page <= reader.NumberOfPages; page++)
{
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();

String s = PdfTextExtractor.GetTextFromPage(reader, page, its);

s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
strText = strText + s;

}
reader.Close();
}
catch (Exception ex)
{
MessageBox.Show(ex.Message);
}
return strText;
}

最佳答案

试试这个,使用 LocationTextExtractionStrategy 而不是 SimpleTextExtractionStrategy 它将向返回的文本添加换行符。然后您可以使用 strText.Split('\n') 将文本拆分为 string[] 并逐行使用它。

关于c# - 每行阅读 PDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8442945/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com