gpt4 book ai didi

.net - 我有数十万页需要扫描和记录

转载 作者:搜寻专家 更新时间:2023-10-30 21:43:22 25 4
gpt4 key购买 nike

我有很多文件要扫描。每个文档都有大约 10 个不同的元数据标签,我希望能够通过这些标签进行搜索。

所以也许我正在考虑买一个巨大的扫描仪,扫描所有东西,但我该如何标记所有东西?我想我会把它们变成 pdf 文件,然后把它们放在 mysql 数据库中?做这个的最好方式是什么。我还想制作一个 GUI 以便能够搜索该数据库。我不想对所有文件进行 OCR,我只想为每个文件附加 10 个关键字。

请向我建议如何执行此操作的系统或程序。我希望可以从多台计算机上搜索到它

需要什么样的编程?

最佳答案

我最近帮助我妻子对她 30 年的创意写作进行了数字备份。她用数百个小笔记本手写了大约 15,000 页。

我们尝试使用平板扫描仪,但笔记本不能平放,她的扫描仪扫描一页最多需要 60 秒,而且有些笔记本更大,不适合她的 letter 大小的平板扫描仪。我知道存在更大、更快的扫描仪,但它仍然过于笨拙和耗时。

我们最终得到了一个安装在小三脚架上的数码相机,直指着书本打开的 table 。使用相机的交流适配器,这样您就可以连续使用数小时而无需更换电池。有些相机甚至可以通过计算机上的 GUI 进行操作,因此您不必冒险通过按下控件来移动它。如果你方便地完成所有这些设置,你可以快速翻页并每隔几秒拍一张照片。这个解决方案要快得多。

我们发现最好将所有照片拍成一本书,然后作为一项单独的任务将它们卸载到计算机上并分类和存档。只是因为将每个页面的相机 UI 更改为目录 UI 会减慢我们的速度。

大多数人都懒得在 RDBMS 中存储大图像,他们只是将图像的文件名存储为字符串,然后为标题、日期和关键字等其他属性添加列。异常(exception)情况是,如果您需要图像遵守 ACID 事务等,这可能不适用于您的情况。

如果您不打算进行 OCR,我想不出一种自动检测关键字的方法。您必须手动输入它们或从列表中选择它们。但同样,最好在捕获图像后将其作为“后处理”任务来完成。

关于.net - 我有数十万页需要扫描和记录,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/1669808/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com