gpt4 book ai didi

Solr 不索引 blob 文件

转载 作者:行者123 更新时间:2023-12-01 13:40:58 25 4
gpt4 key购买 nike

我在我们的 Plone 4.2.6 系统上使用 Collective Solr 4.1.0 Search。

我现在的问题如下。在我们的 Plone 服务器上,我们使用 ZODB 创建 blob 文件。当我现在尝试在 Solr 中构建索引时,出现错误 INFO UniCMSData MISSING BLOB FILE:/opt/plone/data/blobstorage/0x31/0x37/0x32/0x36/​​0x39/0xa2/0xce/0x3e/0x03b3d7af6465c4cc .blob.

路径对我来说很合适,我知道在 opt/plone/data/blobstorage 下存储所有 blob 文件。这让我想知道:是 Solr 没有找到它还是我的 Solr 配置出现了严重错误?还是 Solr 没有正确处理 ZODB blob?

感谢每一个小小的帮助:)

最佳答案

又是我:-)

您的 solr 配置没有任何问题。

Solr 附带一个 pache tika默认情况下,它可以将几乎所有内容转换为文本/纯文本。

但您至少需要 collective.solr 5.0.1,因为使用此版本可以使用 collective.solr BinaryIndexer 直接从 blob 中提取可搜索文本.

如果您无法升级您的 plone 站点/collective.solr,您可以安装 ftw.tika --> https://pypi.python.org/pypi/ftw.tika/2.7.0

ftw.tika 注册了一个 plone portal_transforms,它使用 tika 将许多类型转换为纯文本/文本。您也可以将 tika 作为服务运行。

ftw.tika 兼容 Plone 4.2。

关于Solr 不索引 blob 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/40304102/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com