- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我目前正在尝试使用以下代码使用 itextsharp 从 pdf 文件中读取文本并分配给文本框(多行)-(Windows 桌面应用程序)
注意:这段代码工作正常。
public string ReadPdfFile(string fileName)
{
StringBuilder text = new StringBuilder();
if (File.Exists(fileName))
{
PdfReader pdfReader = new PdfReader(fileName);
for (int page = 1; page <= pdfReader.NumberOfPages; page++)
{
ITextExtractionStrategy strategy = new LocationTextExtractionStrategy();
string currentText = PdfTextExtractor.GetTextFromPage(pdfReader, page, strategy);
currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(currentText)));
text.Append(currentText);
}
pdfReader.Close();
}
return text.ToString();
}
但是我的 pdf 文件有一个方程式
我得到的只是以下输出
可以在此处添加什么以实现以下文本?非常感谢任何形式的帮助!
最佳答案
我使用了 itextsharp,我 100% 确定它不可能。问题出在pdf格式本身。它不包含引用某些文本的任何标签。 Pdf 包含在 pdf 页面上有其位置的内容的特定图形表示。如果没有 OCR,甚至无法检测到粗体文本。PDF 不是解析的好格式。
我的问题比你的更简单,从 pdf 阅读简直是 hell 。它只是文本,但它被格式化为一个 2 页(2 列文本)。Itextsharp 按坐标读取内容,所以当他读取第一列的第一行而不是第二列的第一行时(不是文本流),我的文本混淆了。至于latex,latex代码转成pdf后,latex代码没有逆向。
关于c# - 使用 itextSharp 阅读数学方程式,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/38804864/
我想弄清楚如何将一周内的所有工作时间相加。 “hours”代表一周工作的小时数,“hoursDay”代表一天的工作小时数。唯一的问题是弄清楚如何在它们都由相同的名称表示时将它们全部添加。下面是我的代码
我正在尝试制定一个方程式,根据每 XX 时间的新用户及其推荐用户的输入来确定给定时间的用户数量。 基本上,我们希望每周向系统手动添加 100 个用户。我们假设每个新用户在接下来的每个星期都会再推荐一个
我正在尝试提出一个评级算法 - 所以它会做的是,从用户拥有的一组关键字(用于 SEO)中,为每个关键字提供 1-10 之间的评级(10 是最好的机会来自该集合)- 将通过比较关键字具有的“搜索量”与“
我正在尝试打开队列中的所有弹出窗口,以便它们根据队列数组中的项目数量具有不同的大小和位置。当弹出窗口启动时,想法是它们将完全填满用户屏幕(使用 screen.width 和 screen.height
我已经从一组数据创建了一个 Canvas 饼图,我现在试图定位鼠标相对于饼图的位置,以检测悬停在哪个数据部分。我快到了,但我被一个等式困住了。 我的逻辑运行良好,所以我认为这更像是一道数学题,但我会看
我正在编写一个 python 库来求解各种物理方程,并想为每个方程添加一个方法来显示 LaTeX 格式的方程。我考虑过使用 LaTeX 到 PNG 转换器,然后以某种方式显示与终端内联的图像,这导致我
我的值(value)观是: 0.263 0 0.265 0 0.267 0 0.269 0.0001 0.271 0.0003 0.273 0.0006 0.275 0.0011 0.277 0.00
我的代码在 JavaDoc 注释中通常有很多方程式。我目前正在使用 MathML 来显示这些方程式,因为这是我能够获得可以在 Eclipse 的悬停工具提示中显示的方程式的唯一方法。 我实际上并不关心
是否可以从特定网站导出文本、图像和 LaTeX 方程式,以便您可以直接自定义您自己的 PDF 而不会模糊对象?只有图像具有固定分辨率。 我知道有几种间接生成 PDF 的方法。试图在 Riemann Z
对于我的 C 程序,用户输入“aY + b = c”,其中 a、b 和 c 是 int 值,Y 是“符号常量”。 如何使“aY+b=c”与“aY + b = C”一样有效?基本上,我不确定如何利用 s
我正在根据数据集计算线性回归。我不知道编译时的回归模型或参数数量。 我将回归方程作为字符串存储在 SQL Server 2005 数据库中 y = 3x^2 + 2x // just an examp
我是一名优秀的程序员,十分优秀!