gpt4 book ai didi

mysql - 使用 PHP、Java 从 PDF 或 Word 中提取数据

转载 作者:行者123 更新时间:2023-11-29 14:25:13 24 4
gpt4 key购买 nike

我需要这方面的帮助...特别是因为我不知道从哪里开始..我是一名IT本科生,现在和我的队友一起在一家公司接受在职培训。

场景:该公司要求我们创建一个程序来生成报告并将其存储在数据库中。将使用的数据库是MySQL。至于使用什么语言,我们正在考虑VB.Net、Java、PHP。

该程序必须能够:

  1. 生成一份报告,并通过电子邮件发送至办公室
  2. 存储在数据库中
  3. 收集所有报告,整理这些报告
  4. 生成一份新报告,然后发送到其总部
  5. 然后将其存储在自己的数据库中...

目前,我们仍在尝试确定程序将如何运行以及将使用哪种语言能够从文本文件(可以是 Word 文档或 PDF 文件)中读取和提取数据。

该公司还希望该计划能够在线部署,以便将来进行扩展。

现在,我们的问题是

  1. 有没有办法使用 Java、PHP、VB 从 PDF 或 Word 文件中提取数据,然后将其存储在 MySQL 数据库中?
    • 如果有,是否可以在不使用任何第三方软件的情况下实现?
    • 我们选择使用 PDF 或 Word 文件类型的原因是,该文件应该可以打印以供存档。
  2. 我们可以轻松地使用什么编程语言来实现上述问题?

    如果我提供的信息有点困惑,我深表歉意。一旦我们本周能够与该公司交谈,我将提供更多信息。

    如果我的发帖方式有问题,请见谅。我只是尽力为您提供最好的信息。

最佳答案

我会回答 Java,因为它是我在工作中使用的。

您可以轻松地从 Word 文件中提取文本或使用 Apache POI 构建新的 Word 文件。

对于 PDF,iTextPDFBox两者都做得非常好。

关于mysql - 使用 PHP、Java 从 PDF 或 Word 中提取数据,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/11115447/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com