gpt4 book ai didi

Android,存储大量文本(HTML)并通过它们进行搜索

转载 作者:行者123 更新时间:2023-11-30 00:35:03 26 4
gpt4 key购买 nike

我正在制作一个框架,以便轻松地“应用”书籍。该框架将需要自动检测章节和标题以制作目录。我们的想法是还能够轻松地搜索文本并找到您要查找的内容。

现在我还需要搞清楚的是:

  1. 如何以易于检测章节和标题的方式存储数据
  2. 并且仍然能够搜索文本。

存储的文本需要格式化,所以我想我将它们存储为 HTML 或 Markdown(将被翻译成 HTML)。如果文本是 HTML 格式,我认为它不会很容易被搜索到。

附言如果有其他更有效的方法来格式化文本,则不必是 HTML。

最佳答案

你真的想在设备上做这样的事情吗?

我可以建议您为每本书使用单独的 sqlite 数据库。目录、章节、章节摘要关键字(用于更快的搜索)和其他服务信息的单独表格。

还有 here you can find full text search example

另外,我建议您在您的应用中使用自己的 sqlite 构建。

现在让我们谈谈您的主要问题 - 图书抓取。我没有这方面的能力,我相信这个问题和网站抓取一样。

更新:请不要将书籍内容存储为 HTML,您可以将其存储为 Markdown ,例如,它占用更少的存储空间,更容易清理,并且您以后可以随时应用您的样式

关于Android,存储大量文本(HTML)并通过它们进行搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43570813/

26 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com