- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我正在尝试使用 PDFBOX 从 pdf 中获取文本,我正在开发一个 Maven jee 项目,我已经包含了所有可能的依赖项,但我仍然遇到下一个错误
`2017-01-29T16:01:50.069+0100|Avertissement: StandardWrapperValve[ViewCrous]: Servlet.service() for servlet ViewCrous threw exception
java.lang.NoClassDefFoundError: org/apache/pdfbox/pdmodel/PDDocument
at ViewCrous.doGet(ViewCrous.java:27)
at javax.servlet.http.HttpServlet.service(HttpServlet.java:687)
at javax.servlet.http.HttpServlet.service(HttpServlet.java:790)
at org.apache.catalina.core.StandardWrapper.service(StandardWrapper.java:1682)
at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:318)
at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:160)
at org.apache.catalina.core.StandardPipeline.doInvoke(StandardPipeline.java:734)
at org.apache.catalina.core.StandardPipeline.invoke(StandardPipeline.java:673)
at com.sun.enterprise.web.WebPipeline.invoke(WebPipeline.java:99)
at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:174)
at org.apache.catalina.connector.CoyoteAdapter.doService(CoyoteAdapter.java:416)
at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:283)
at com.sun.enterprise.v3.services.impl.ContainerMapper$HttpHandlerCallable.call(ContainerMapper.java:459)
at com.sun.enterprise.v3.services.impl.ContainerMapper.service(ContainerMapper.java:167)
at org.glassfish.grizzly.http.server.HttpHandler.runService(HttpHandler.java:206)
at org.glassfish.grizzly.http.server.HttpHandler.doHandle(HttpHandler.java:180)
at org.glassfish.grizzly.http.server.HttpServerFilter.handleRead(HttpServerFilter.java:235)
at org.glassfish.grizzly.filterchain.ExecutorResolver$9.execute(ExecutorResolver.java:119)
at org.glassfish.grizzly.filterchain.DefaultFilterChain.executeFilter(DefaultFilterChain.java:283)
at org.glassfish.grizzly.filterchain.DefaultFilterChain.executeChainPart(DefaultFilterChain.java:200)
at org.glassfish.grizzly.filterchain.DefaultFilterChain.execute(DefaultFilterChain.java:132)
at org.glassfish.grizzly.filterchain.DefaultFilterChain.process(DefaultFilterChain.java:111)
at org.glassfish.grizzly.ProcessorExecutor.execute(ProcessorExecutor.java:77)
at org.glassfish.grizzly.nio.transport.TCPNIOTransport.fireIOEvent(TCPNIOTransport.java:536)
at org.glassfish.grizzly.strategies.AbstractIOStrategy.fireIOEvent(AbstractIOStrategy.java:112)
at org.glassfish.grizzly.strategies.WorkerThreadIOStrategy.run0(WorkerThreadIOStrategy.java:117)
at org.glassfish.grizzly.strategies.WorkerThreadIOStrategy.access$100(WorkerThreadIOStrategy.java:56)
at org.glassfish.grizzly.strategies.WorkerThreadIOStrategy$WorkerThreadRunnable.run(WorkerThreadIOStrategy.java:137)
at org.glassfish.grizzly.threadpool.AbstractThreadPool$Worker.doWork(AbstractThreadPool.java:591)
at org.glassfish.grizzly.threadpool.AbstractThreadPool$Worker.run(AbstractThreadPool.java:571)
at java.lang.Thread.run(Thread.java:745)
Caused by: java.lang.ClassNotFoundException: org.apache.pdfbox.pdmodel.PDDocument
at org.glassfish.web.loader.WebappClassLoader.loadClass(WebappClassLoader.java:1783)
at org.glassfish.web.loader.WebappClassLoader.loadClass(WebappClassLoader.java:1633)
... 31 more
`我使用的java代码是:
`
//Loading the grill menu
File file = new File("./Menu_GRILL.pdf");
PDDocument document = PDDocument.load(file);
//Instantiate PDFTextStripper class
PDFTextStripper pdfStripper = new PDFTextStripper();
//Retrieving text from PDF document
String text = pdfStripper.getText(document);
System.out.println(text);
//Closing the document
document.close();`
我的 pom 文件中的依赖项是:
`<!-- https://mvnrepository.com/artifact/org.apache.pdfbox/pdfbox -->
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.1</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>fontbox</artifactId>
<version>2.0.0</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>jempbox</artifactId>
<version>1.8.11</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>xmpbox</artifactId>
<version>2.0.0</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>preflight</artifactId>
<version>2.0.0</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox-tools</artifactId>
<version>2.0.0</version>
</dependency>
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>debugger-app</artifactId>
<version>2.0.4</version></dependency>
需要你们的帮助......
最佳答案
您在 pom 文件中使用了 4 个不同的版本(1.8.11、2.0.0、2.0.1、2.0.4)。删除所有带有“org.apache.pdfbox”的内容并仅使用此:
<dependency>
<groupId>org.apache.pdfbox</groupId>
<artifactId>pdfbox</artifactId>
<version>2.0.4</version>
</dependency>
还要确保该库及其依赖项位于您的 war 文件中。
关于java - 为什么我不能在 java ee 项目中使用 PDDOCUMENT PDFBOX ?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/41922415/
我正在尝试通过org.apache.pdfbox.multipdf.Splitter拆分pdf文档,并且需要在此单页PDDocument上执行某些文件操作, 如何将 PDDocument 转换为 Ja
我正在尝试创建一个PDDocument,然后向其中添加两个页面。第一个包含文本“第一页”,第二个为空白。然后,我拆分 PDDocument 并将其放入列表中。当我尝试访问第一页(通过使用 get 方法
您是否只需要在加载/保存操作后或创建每个新的 PDDocument 对象后关闭 PDDocument(例如,在执行合并/拆分/...操作时)? 例如,我有 3 个从字节数组加载的 PDDocument
我用 iText 创建了一个文档,我想将该文档(保存为 PDF 文件)转换为图像。为此,我使用 PDFBox,它需要一个 PDDocument 作为输入。我使用以下代码: @SuppressWarni
我正在尝试从 PDDocument 中检索 File 或 InputStream 实例,而不将 PDDocument 保存到文件中系统。 PDDocument doc= new PDDocument
PDPage 对象是否包含对其所属的 PDDocument 的引用? 换句话说,PDPage 是否了解其 PDDocument? 在应用程序的某个位置我有一个 PDDocuments 列表。 这些文档
本质上,我试图用 Java 创建一个小工具,从某种用户输入中获取文本,考虑一个普通的文本框,并用它创建一个 PDF 文件。 到目前为止,我已经成功地利用我对 PDFBox 的基本知识快速地抓取了一些东
我目前使用 PdfBox 作为 pdf 文件编辑器应用程序的驱动程序。我需要将 pdf 文件 (PDDocument) 的 PdfBox 表示形式的内容作为字节数组。有谁知道如何做到这一点? 最佳答案
我正在尝试使用 PDFBOX 从 pdf 中获取文本,我正在开发一个 Maven jee 项目,我已经包含了所有可能的依赖项,但我仍然遇到下一个错误 `2017-01-29T16:01:50.069+
我越来越熟悉 PDFBox 的各种风格。我想知道是否有办法将 pdf-layout 元素放入 PDDocument 对象中。 pdf-layout 元素使用 Document 作为父元素,PDFBox
我在编译过程中遇到以下错误。我正在使用 Eclipse IDE 并在 Ubuntu 上工作。我在构建路径中添加了以下 jar 文件 1) pdfbox 1.8.13 及其所有依赖项 2) Common
我正在使用 Pdfbox (1.8.8) 将附件添加到 pdf。我的问题是,当其中一个附件的类型为 .pdf 并且我将 PDDocument 保存到 OutputStream 时,最终的 pdf 文档
我有一些关于解析 pdf 和 fd 的问题: 使用的目的是什么 PDDocument.loadNonSeq 方法包含临时/临时文件? 我有一个很大的 pdf 文件,我需要解析它并获取文本内容。我使用
我想验证创建的pdf(不是作为文件),而是作为下载到浏览器的ByteArrayOutputStream。为了避免安全问题,可能想使用 pdfbox preflightparser 进行验证,其中它只能
我制作了一个 pdf 表格,我正在尝试使用 pdfBox 填写表格并打印文档。我让它非常适合 1 页打印作业,但我不得不尝试修改多页。基本上它是一个顶部有基本信息和内容列表的表格。好吧,如果内容大于表
我已经在以前的版本中看到了如何执行此操作,如下所示: How to extract font styles of text contents using pdfbox? 但我认为 getFonts()
如何使用PDFBox 2.0.0中的分页功能。我使用 PDFBox 1.8.3 完成我的申请。我可以使用 PDFBox 1.8.3 将文档设置为可分页格式。但我无法在 2.0.0 中将文档设置为可分页
我正在使用 PDFBox从我的网络应用程序创建 PDF。 Web 应用程序是用 Java 构建的,并使用 JSF。它从基于 Web 的表单中获取内容并将内容放入 PDF 文档中。 示例:用户在表单中填
我正在尝试使用 PDDocument 在 Java 中创建临时 PDF 文件。我正在使用以下方法创建临时 PDF 文件。 /* Create a temporary PDF file.*/ priva
我使用的是 PDFBOX 1.8.10。 如果我将 PDF 文件加载到字节数组中,它就可以工作 - File file = new File(args[0]); FileInputStream fis
我是一名优秀的程序员,十分优秀!