gpt4 book ai didi

solr - 使用 Lucidworks Fusion 而不是常规 Solr 的优缺点

转载 作者:行者123 更新时间:2023-12-03 16:45:57 29 4
gpt4 key购买 nike

我想知道使用 Fusion 而不是常规 Solr 的优缺点是什么?你们能举一些例子吗(比如一些可以使用Fusion轻松解决的问题)?

最佳答案

首先,我应该透露我是 Lucidworks Fusion 的产品经理。

您似乎已经知道 Fusion 与 Solr(或一个或多个 Solr 集群或实例)一起使用,使用 Solr 进行数据存储和查询。 Fusion 的目的是简化 Solr 的使用、集成 Solr 以及构建利用 Solr 的复杂解决方案。 Fusion 提供的一些对许多人有帮助的东西包括:

  • 连接器和连接器框架。 Bare Solr 为您提供了良好的 API 以及在命令行推送某些类型文件的能力。 Fusion 带有几个预先构建的数据源连接器,它们从各种类型的系统中获取数据,适本地处理它们(包括解析、转换和字段映射),并将结果发送到 Solr。这些连接器包括通用文档存储(云和本地)、关系数据库、NoSQL 数据存储、HDFS、企业应用程序以及非常强大且可配置的网络爬虫。
  • 安全集成。 Solr 没有任何身份验证或授权(尽管从本周的 5.2 版开始,它确实有一个可插入的 API 和一个用于身份验证的 Kerberos 基本实现)。 Fusion 使用安全版本包装 Solr API。 Fusion 干净地集成到 LDAP、Active Directory 和 Kerberos 以进行身份​​验证。它还具有用于管理和配置 Fusion 和 Solr 的细粒度授权模型。而且,Fusion 授权模型可以自动将来自 LDAP/AD 的组成员资格与来自 Fusion Connectors 数据源的访问控制列表关联起来,以便您在运行搜索查询时获得从源系统镜像的文档级访问控制。
  • 管道处理模型。 Fusion 提供了一个带有模块化阶段(API 和 GUI 形式)的管道模型,以便更轻松地定义和编辑数据和文档的转换。它类似于 unix shell 管道。例如,在建立索引时,您可以在写入 Solr 之前包含定义字段映射、计算新字段、聚合文档、从其他来源提取数据等阶段。查询时,您可以执行相同的操作,同时转换查询、运行和返回其他分析的结果,以及应用安全过滤。
  • 管理图形用户界面。 Fusion 有一个用于查看和配置上述内容的 Web UI(以及基本的 Solr 配置)。我们认为这对于想要使用 Solr 但不经常使用它以记住如何使用 API、配置文件和命令行工具的人来说很方便。
  • 复杂的基于搜索的功能:使用上述管道模型,Fusion 包含(并使其易于使用)一些更丰富的基于搜索的组件,包括: 自然语言处理和实体提取模块;实时信号驱动的相关性调整。我们打算在 future 提供更多这样的功能。
  • 分析处理:Fusion 包含并集成了 Apache Spark,用于对存储在 Solr(或正在进入 Solr)中的数据运行深度分析。虽然 Solr 隐含地包含某些数据分析功能,但这不是它的主要目的。我们使用 Apache Spark 来驱动 Fusion 的信号提取和相关性调整,并期望公开 API,以便用户可以轻松地在那里运行其他处理。
  • 其他:许多有用的杂项功能,例如:仪表板 UI;具有手动相关性调整的基本搜索 UI;更容易监控;作业管理和调度;具有电子邮件集成的实时警报等。

  • 上面的很多内容当然可以在没有 Fusion 的情况下针对 Solr 构建或编写,但我们认为提供这些类型的企业集成对很多人来说都是有值(value)的。

    关于solr - 使用 Lucidworks Fusion 而不是常规 Solr 的优缺点,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/30773135/

    29 4 0
    Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
    广告合作:1813099741@qq.com 6ren.com