- Java 双重比较
- java - 比较器与 Apache BeanComparator
- Objective-C 完成 block 导致额外的方法调用?
- database - RESTful URI 是否应该公开数据库主键?
我有很多文件要扫描。每个文档都有大约 10 个不同的元数据标签,我希望能够通过这些标签进行搜索。
所以也许我正在考虑买一个巨大的扫描仪,扫描所有东西,但我该如何标记所有东西?我想我会把它们变成 pdf 文件,然后把它们放在 mysql 数据库中?做这个的最好方式是什么。我还想制作一个 GUI 以便能够搜索该数据库。我不想对所有文件进行 OCR,我只想为每个文件附加 10 个关键字。
请向我建议如何执行此操作的系统或程序。我希望可以从多台计算机上搜索到它
需要什么样的编程?
最佳答案
我最近帮助我妻子对她 30 年的创意写作进行了数字备份。她用数百个小笔记本手写了大约 15,000 页。
我们尝试使用平板扫描仪,但笔记本不能平放,她的扫描仪扫描一页最多需要 60 秒,而且有些笔记本更大,不适合她的 letter 大小的平板扫描仪。我知道存在更大、更快的扫描仪,但它仍然过于笨拙和耗时。
我们最终得到了一个安装在小三脚架上的数码相机,直指着书本打开的 table 。使用相机的交流适配器,这样您就可以连续使用数小时而无需更换电池。有些相机甚至可以通过计算机上的 GUI 进行操作,因此您不必冒险通过按下控件来移动它。如果你方便地完成所有这些设置,你可以快速翻页并每隔几秒拍一张照片。这个解决方案要快得多。
我们发现最好将所有照片拍成一本书,然后作为一项单独的任务将它们卸载到计算机上并分类和存档。只是因为将每个页面的相机 UI 更改为目录 UI 会减慢我们的速度。
大多数人都懒得在 RDBMS 中存储大图像,他们只是将图像的文件名存储为字符串,然后为标题、日期和关键字等其他属性添加列。异常(exception)情况是,如果您需要图像遵守 ACID 事务等,这可能不适用于您的情况。
如果您不打算进行 OCR,我想不出一种自动检测关键字的方法。您必须手动输入它们或从列表中选择它们。但同样,最好在捕获图像后将其作为“后处理”任务来完成。
关于.net - 我有数十万页需要扫描和记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1669808/
我有一个网站。 必须登录才能看到里面的内容。 但是,我使用此代码登录。 doc = Jsoup.connect("http://46.137.207.181/Account/Login.aspx")
我正在尝试为我的域创建一个 SPF 记录并使我的邮件服务器能够对其进行评估。我在邮件服务器上使用 Postfix 并使用 policyd-spf (Python) 来评估记录。目前,我通过我的私有(p
我需要为负载平衡的 AWS 站点 mywebsite.com 添加 CName 记录。记录应该是: @ CNAME mywebsite.us-east-1.elb.amazon
我目前正在开发一个相当大的多层应用程序,该应用程序将部署在海外。虽然我希望它在解聚后不会折叠或爆炸,但我不能 100% 确定这一点。因此,如果我知道我可以请求日志文件,以准确找出问题所在以及原因,那就
我使用以下命令从我的网络摄像头录制音频和视频 gst-launch-0.10 v4l2src ! video/x-raw-yuv,width=640,height=480,framerate=30/1
我刚刚开始使用 ffmpeg 将视频分割成图像。我想知道是否可以将控制台输出信息保存到日志文件中。我试过“-v 10”参数,也试过“-loglevel”参数。我在另一个 SO 帖子上看到使用 ffmp
我想针对两个日期查询我的表并检索其中的记录。 我这样声明我的变量; DECLARE @StartDate datetime; DECLARE @EndDate datetime; 并像这样设置我的变量
在 javascript 中,我可以使用简单的 for 循环访问对象的每个属性,如下所示 var myObj = {x:1, y:2}; var i, sum=0; for(i in myObj) s
最近加入了一个需要处理大量代码的项目,我想开始记录和可视化调用图的一些流程,让我更好地理解一切是如何组合在一起的。这是我希望在我的理想工具中看到的: 每个节点都是一个函数/方法 如果一个函数可以调用另
如何使用反射在F#中创建记录类型?谢谢 最佳答案 您可以使用 FSharpValue.MakeRecord [MSDN]创建一个记录实例,但是我认为F#中没有任何定义记录类型的东西。但是,记录会编译为
关闭。这个问题不满足Stack Overflow guidelines .它目前不接受答案。 想改善这个问题吗?更新问题,使其成为 on-topic对于堆栈溢出。 3年前关闭。 Improve thi
我是 Sequelize 的新手并且遇到了一些语法问题。我制作了以下模型: // User sequelize.define('user', { name: { type: DataTyp
${student.name} Notify 这是我的output.jsp。请注意,我已经放置了一个链接“Notify”以将其转发到 display.jsp 上。但我不确定如何将 Stud
例如,这是我要做的查询: server:"xxx.xxx.com" AND request_url:"/xxx/xxx/xxx" AND http_X_Forwarded_Proto:(https O
我一直在开发大量 Java、PHP 和 Python。所有这些都提供了很棒的日志记录包(分别是 Log4J、Log 或logging)。这在调试应用程序时有很大帮助。特别是当应用程序 headless
在我的Grails应用程序中,我异步运行一些批处理过程,并希望该过程记录各种状态消息,以便管理员以后可以检查它们。 我考虑过将log4j JDBC附加程序用作最简单的解决方案,但是据我所知,它不使用D
我想将进入 MQ 队列的消息记录到数据库/文件或其他日志队列,并且我无法修改现有代码。是否有任何方法可以实现某种类似于 HTTP 嗅探器的消息记录实用程序?或者也许 MQ 有一些内置的功能来记录消息?
如果我有一条包含通用字段的记录,在更改通用字段时是否有任何方法可以模仿方便的 with 语法? 即如果我有 type User = // 'photo can be Bitmap or Url {
假设我有一个名为 Car 的自定义对象。其中的所有字段都是私有(private)的。 public class Car { private String mName; private
当记录具有特定字段时,我需要返回 true 的函数,反之亦然。示例: -record(robot, {name, type=industrial, ho
我是一名优秀的程序员,十分优秀!