gpt4 book ai didi

python - 平面 HTML 页面的搜索索引

转载 作者:太空宇宙 更新时间:2023-11-03 19:06:33 24 4
gpt4 key购买 nike

我希望将搜索功能添加到现有的完全静态网站中。新的搜索功能本身可能需要是动态的,因为搜索索引需要定期更新(当人们对静态内容进行更改时),并且当用户与其交互时需要动态生成搜索结果。我希望使用 Python 添加此功能,因为这是我的首选语言,但我对想法持开放态度。

在这种情况下,Google Web Search API 将不起作用,因为索引的内容位于专用网络上。 Django haystack 不适用于这种情况,因为这要求内容存储在 Django 模型中。一个名为 mnoGoSearch 的工具可能是一个选择,因为我认为它可以像 Google 那样抓取网站,但我不确定该项目现在有多活跃;该项目网站似乎有点过时了。

我对使用 Solr、ElasticSearch 或 Whoosh 等工具很好奇,尽管我相信这些工具只是索引引擎,并不处理搜索内容的解析。有人对如何索引静态 html 内容以作为一组搜索结果进行检索有任何建议吗?感谢您的阅读和任何反馈。

最佳答案

使用 Solr,您可以编写代码来检索要索引的内容,从每个项目中解析出目标部分,然后将其发送到 Solr 进行索引。

然后,您将与 Solr 进行交互以进行搜索,并让它返回整个索引文档、ID 或有关原始索引内容的其他一些标识信息,并使用它向用户显示结果。

关于python - 平面 HTML 页面的搜索索引,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/14570901/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com