gpt4 book ai didi

android - 如何搜索 HTML 中的内容而不是标签

转载 作者:行者123 更新时间:2023-11-29 03:24:18 25 4
gpt4 key购买 nike

我有一个内容数据库,其中大部分是 HTML 页面,然后用于在应用程序中显示。

我们正在寻求构建搜索功能,但我对由于包含 HTML 代码的结果而出现误报感到担忧。

例如,搜索“title”将返回任何具有 title html 标签的内容页面

我们目前正在使用 NSPredicates 在 Core Data 数据库上执行查询。

是否有任何简单/有效的方法来防止返回这些结果?

我在 Windows 和 Android 上也遇到同样的问题!

最佳答案

iOS 的一个想法是除了 HTML 版本之外,实际上存储一个单独的文本版本。然后,您可以使用非常简单(即使不是很有效)的谓词谎言

[NSPredicate predicateWithFormat:@"text CONTAINS[cd] %@", searchText]; 

一种更高效的方法是删除单词并将它们以小写形式存储在另一个实体的索引属性中。

在这两种情况下,都应该通过可用的库之一预先完成解析(例如参见评论中的链接)。

关于android - 如何搜索 HTML 中的内容而不是标签,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20663824/

25 4 0