gpt4 book ai didi

c# - 在 C# 中比较两个 PDF 文件

转载 作者:行者123 更新时间:2023-11-30 22:25:24 25 4
gpt4 key购买 nike

我有两个 pdf 文件,我想比较这两个 pdf 文件并在消息框中打印差异。

到目前为止我有这个(但它没有像我预期的那样工作):

  private void button1_Click(object sender, EventArgs e)
{
string str1 = this.textBox1.Text;
string str2 = this.textBox2.Text;

string comparison = str1.Replace(str2,"");
MessageBox.Show(comparison);
}


private void ParsePDF(string filePath)
{
string text = string.Empty;

PdfReader reader = new iTextSharp.text.pdf.PdfReader(filePath);
byte[] streamBytes = reader.GetPageContent(1);
PRTokeniser tokenizer = new PRTokeniser(streamBytes);

while (tokenizer.NextToken())
{
if (tokenizer.TokenType == PRTokeniser.TokType.STRING)
{
text += tokenizer.StringValue;
}
}
this.textBox1.Text = text.ToString();
this.textBox2.Text = text.ToString();
}

}

在下面,我调用该方法:ParsePDF("C://Users//lf222aw//Desktop//file1.pdf");

我的程序是这样工作的:假设我有一个带有文本“我爱 stackoverflow”的文本框和另一个文本框“我是 stackoverflow”,我的程序打印的结果是:“我喜欢 stackoverflow”,我想打印的是“love”,作为这两个文件之间的区别

有什么想法吗?问候,

最佳答案

在下面的链接中查看 Github 存储库。

google-diff-match-patch

它是一个用于字符串比较的开源库。它是用多种语言编写的,包括 C#。您可以计算两个字符串值或文本文档之间的增量差异。

关于c# - 在 C# 中比较两个 PDF 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12331205/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com