django - Django haystack 和 whoosh 的字符折叠-6ren

django - Django haystack 和 whoosh 的字符折叠

转载作者：行者123 更新时间：2023-12-03 17:51:24

25

4

我有一个基于 django 的应用程序，带有 haystack 和 whoosh 搜索引擎。我想提供与重音和特殊字符无关的搜索，以便我也可以使用没有特殊字符的单词找到带有特殊字符的索引数据:

索引是:

'café'

搜索词:

'cafe'  
'café'

我写了一个特定的 FoldingWhooshSearchBackend，它使用了 StemmingAnalyzer和一个 CharsetFilter(accent_map)如以下文件所述:

https://gist.github.com/gregplaysguitar/1727204

然而，搜索仍然无法像预期的那样工作，即我无法使用“cafe”进行搜索并找到“café”。我已经使用以下方法查看了搜索索引:

from whoosh.index import open_dir
ix = open_dir('myservice/settings/whoosh_index')
searcher = ix.searcher()
for doc in searcher.documents():
    print doc

特殊字符仍在索引中。

我需要做一些额外的事情吗？是关于改变索引模板吗？

最佳答案

你必须写Haystack SearchIndex您的模型的类。这就是您可以为搜索索引准备模型数据的方式。

myapp/search_index.py 示例:

from haystack import site
from haystack import indexes

class UserProfileIndex(indexes.SearchIndex):
    text = indexes.CharField(document=True)

    def prepare_text(self, obj):
        data = [obj.get_full_name(), obj.user.email, obj.phone]
        original = ' '.join(data)
        slugified = slugify(original)
        return ' '.join([original, slugified])

site.register(UserProfile, UserProfileIndex)

如果用户有姓名 café ，您会在搜索词中找到他的个人资料 café和 cafe .

关于django - Django haystack 和 whoosh 的字符折叠，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/20702269/

25

4

0

文章推荐： css - padding-left 在表格内

文章推荐： laravel-4 - Laravel 4.1 Eloquent ORM 自定义表名

django-haystack - Django Haystack 重建索引
我正在阅读 Haystack 的“入门”指南，并尝试使用 Haystack 为我的网站实现 Whoosh 后端。我成功设置了整个项目，还可以在我的 search.html 模板上看到搜索框。我无法建立
django-haystack - django haystack 自定义表单
我正在尝试使用 django haystack 制作自定义搜索表单，我只是从 haystack 的文档中修改: 表格.py from django import forms from haystack
django-haystack - Django Haystack - 如何按时间戳排序？
我是 Django 和 Haystack 的新手...我需要知道如何按日期/时间戳对搜索结果进行排序，最近的排在最前面。这是我的模型.py: class adsText(models.Model):
django-haystack - Django - 两个不同应用程序中的 Haystack
我在一个应用程序中使用 Haystack，它非常完美。它正在索引我需要的一切。但是，现在我创建了另一个应用程序，具有不同的模型和内容，我想用 Haystack 索引它。我的想法是在我的网站上创建两个不
django-haystack - 模型类型上的 Django Haystack 分面
我想根据返回的不同模型名称(类)对结果进行分面。是否有捷径可寻？最佳答案您是否尝试添加 SearchIndex字段与此信息？例如。 class NoteIndex(SearchIndex, ind
django-haystack - 如何拆分 django-haystack 搜索表单和结果
我想在我博客的 base.html 模板上使用 django-haystack 的搜索表单，但结果在不同的模板页面上，我该怎么做？最佳答案构造表单以将数据提交到正确的 URL，
django-haystack - Haystack 查询集包含 None 元素
我使用 Haystack 进行搜索，返回的结果 SearchQuerySet 包含 None 元素: >> SearchQuerySet().models(Question, Document, Id
django-haystack - Haystack - 为什么 RealtimeSearchIndex 有时不更新我保存的对象
我在 Django 中使用 Haystack 和 Whoosh 在 search_index.py 我有这个 class PageIndex(RealTimeSearchIndex): tex
django-haystack - 无法订购 Haystack/Whoosh 结果(而且速度非常慢)
我正在使用 Haystack和 Whoosh使用来自 Geonames 的城市数据搜索自定义应用程序项目。我只导入了少量 Geonames 城市数据(22917 条记录)。我想按城市人口对结果进行排
python - Haystack SearchQuerySet 不会过滤具有一个字符的 CharField (Whoosh/django-haystack)
我将 Django 1.5.1 与 django-haystack 2.1.0 和 whoosh 2.5.2 后端一起使用: 模型.py: GENDER_CHOICES = ( (u'M',
python - 在 virtualenv 中安装 django haystack 后出现 "Error: No module named haystack"
我在生产服务器上安装 django-haystack 时遇到问题。当我运行以下任何命令时，出现错误No module named haystack: python manage.pysyncdb p
python - Django-haystack:添加自动完成所需的 `content_auto` 行后，rebuild_index 失败(haystack.exceptions.SearchFieldError)
我正在尝试为只搜索单词的一部分(如果我没记错的话，根据 Haystack 文档称为 autocomplete)实现生成结果。示例: 搜索 "gol" 结果 "goldfish" 我尝试了什么？我按
Django Haystack - 如何提升一个领域？
我在 Django Haystack 1.2.5 中遇到了一些问题。我需要提升一个领域，但显然它不起作用。我正在使用 Solr 1.4.1。我的指数: class JobsTextIndex(ind
django - haystack - 如何使用外键显示来自多个模型的数据？
我有两个模型: 模型.py class model1 (models.Model): field1_model1 = models.CharField() filed2_model1 =
django - haystack 没有索引我的多值
我正在尝试获取 MultiValueField被索引，但它只是不工作。这是我所拥有的: 类 Public_PollIndex(SearchIndex): text = CharField(model_
Django Haystack 更新索引更快
我已经使用 Django Haystack 一段时间了，它很棒!我有一个相当繁重的网站，其中的数据需要不时更新(15 到 30 分钟)。使用 python manage.py update_inde
django haystack 高亮模板标签问题
有没有办法制作 django-haystack 的 {% highlight %}模板标签显示传入的完整变量，而不是在第一次匹配之前删除所有内容？我是这样使用它的: {% highlight thr
django haystack 如何在单词中查找子字符串？
在我的领域中，内容是“示例”。我不仅想找到确切的单词“example”，我还想找到“examp”。我怎样才能做到这一点？有没有选择。找不到任何东西。最佳答案如果您只想搜索以某个字符串开头的对象，那
Django Haystack - 未设置拼写建议上下文变量
我已经使用 Solr 在 Haystack 中正确配置了拼写建议的所有内容，但是，当使用 SearchView 时，suggestion 上下文变量未设置。我意识到这是由于 https://githu
django - Haystack Django一次搜索多个字段
使用elasticsearch(2.x)，django-haystack(2.8.0)，drf-haystack(1.8.6)我建立了搜索。一切工作正常，除了我不能同时搜索多个字段。现在，我只能搜索(

首页

博学

6Ren·AI

商城

django - Django haystack 和 whoosh 的字符折叠