- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我们正在公司中搜索不同的数据源。我们有多个数据库中的信息,需要从我们的Intranet中进行搜索。全文搜索(FTS)的初步实验令人失望。我们已经实现了一个自定义搜索引擎,可以很好地满足我们的目的。但是,我们要确保我们做的是“正确的事情”,并且不会丢失任何会使我们的工作变得更轻松的出色工具。
我们需要的:
列搜索
按列搜索的能力
我们标记表中哪些列是可搜索的
在数据库列和数据之间保持某种关系
我们提供对结果的高级过滤
促进(亚马逊风格)过滤
通过结果分组提供过滤器,并允许用户通过复选框过滤它们
这是一个很棒的功能,用户非常喜欢
部分词匹配
我们有很多唯一的标识符(产品ID等)。
唯一ID可以包含具有含义的子部分(位置等)
或只有一部分可用(当用户搜索时)
或(由于绝对错误的设计决定)id中可能有空白
这是我们现在通过CHARINDEX(MSSQL)和INSTR(ORACLE)实现的一项主要功能
与全文相比,使用char索引函数在MSSQL上的性能等效(+/-)
没有在Oracle上测试
但是针对两种类型的数据库的搜索都非常快
我们利用索引(MSSQL)和物化(Oracle)视图来提高速度
这是一个巨大的胜利,Oracle物化视图优于MSSQL索引视图
两者都在只读联接情况下(例如搜索梳理公司和产品)提供加速
符合用户对范例的期望的搜索CTRL-f->输入文本->查找匹配项
全文搜索在该领域不是最好的(匹配缓慢且不一致)
部分匹配(请参阅“部分单词匹配”)
很高兴有:
实时搜索数据库
跳过索引跳过,这不是硬性要求
拼写建议
Xapian有这个http://xapian.org/docs/spelling.html
类似于Google的“您是不是要说:”
我们不需要的:
我们不需要索引文件
在这一点上,搜索我们的数据源是最重要的
即使我们搜索文档,我们也会寻找部分单词匹配等
排行
我们自己的简单排名算法已证明比FTS等效要好得多。
用户了解它,我们了解它,它几乎总是相关的。
抽干
只是不需要获取[运行|运行|运行]
进阶搜寻运算子
词组匹配,或/和,等等
根据雅各布·尼尔森http://www.useit.com/alertbox/20010513.html
大多数用户使用简单的搜索词组
很少使用高级搜索(如果可用)
也位于Information Architecture 3rd Edition Page 185中
“很少有用户会利用它们[高级搜索功能]”
http://oreilly.com/catalog/9780596000356
我们的类似Amazon的过滤功能无论如何都可以实现更好的过滤(通过用户测试)
全文搜索
我们发现结果并不总是对用户“有意义”
使用FTS进行搜索很难调优(哪些运营商符合用户期望)
高级搜索运算符绝不可行
我们不需要它们,因为
用户不理解
性能与char索引函数非常接近(+ / 1)
但结果有时只是“怪异”
问题:
有没有一种解决方案可以让我们保留键值对的“过滤功能”,提供特定于列的匹配,部分单词匹配以及其余功能,而无需进行全文搜索?
我愿意接受任何建议。我想知道是否可以使用文档/哈希表nosql数据存储(MongoDB等)? (http://www.mongodb.org/display/DOCS/Full+Text+Search+in+Mongo)。任何经验,不胜感激。
同样,只要确保我们内部定制版本不会丢失任何内容即可。如果有“现成的”东西,我会对它感兴趣。或者,如果您是从某些组件中构建的,那么您使用了哪些组件(搜索引擎,数据存储等),为什么?
您也可以为FTS做好准备。在您说“只使用全文搜索,因为这是我们拥有的唯一工具”之前,只需确保它满足上述要求即可。
最佳答案
我最终编写了自己的代码。
结果太棒了。用户喜欢它,它可以与我们现有的技术很好地配合使用。
真的不是那么难。只是花了一些时间。
特征:
多面搜索(亚马逊,沃尔玛等)
部分单词搜索(真正的东西不是全文)
搜索数据库(Oracle,SQL Server等)和非数据库源
与我们现有的环境很好地集成
保持关系,所以我可以进行n到n的搜索和显示
->这意味着我可以在搜索结果中显示主记录的子记录
->我也可以搜索任何子字段并返回主记录
使用字典和大量内存可以做的事情真是令人惊讶。
关于sql-server - 如何实现企业搜索,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/3198901/
本周我将在 Windows Server 2008 上设置一个专用的 SQL Server 2005 机器,并希望将其精简为尽可能简单,同时仍能发挥全部功能。 为此,“服务器核心”选项听起来很有吸引力
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 这个问题似乎与 help center 中定义的范围内的编程无关。 . 已关闭 8 年前。 Improve
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
我获取了 2014 版本数据库的备份,并尝试在另一台服务器中将其恢复到具有相同名称和登录名的数据库中。此 SQL Server 版本是 2016。 恢复备份文件时,出现此错误: TITLE: Micr
TFS 是否提供任何增强的方法来存储对 sql server 数据库所做的更改,而不是使用它来对在数据库上执行的 sql 语句的文本文件进行版本控制? 或者我正在寻找的功能是否仅在第 3 方工具(如
关闭。这个问题需要多问focused 。目前不接受答案。 想要改进此问题吗?更新问题,使其仅关注一个问题 editing this post . 已关闭 9 年前。 Improve this ques
我即将将我的 SQL Server 2012 实例升级到 SQL Server 2014。 我已经克隆了主机 Windows VM 并将其重命名为 foo-2012至 foo-2014 . 重新启动时
我想为 SQL Server 登录授予对数据库的访问权限。我知道 sp_grantdbaccess,但它已被弃用。我可以改用什么以及如何检查登录名是否还没有访问数据库的权限? 场景:UserA 创建数
客户别无选择,只能在接下来的几天内从 sql server 2000 迁移到 2008。测试显示 2005 年的重要功能出现了 Not Acceptable 性能下降,但 2008 年却没有。好消息是
我有一个测试数据库,我需要将其导出到我们客户的测试环境中。 这将是一次性的工作。 我正在使用 SQL Server 2005(我的测试数据库是 SQL Server 2005 Express) 执行此
我需要将一个 CSV 文件导入到 mongoDB 不幸的是我遇到了以下错误: error connecting to host: could not connect to server: se
我以为 R2 是一个补丁/服务包。我一直在寻找下载,但没有看到。因此,我假设 R2 是一个新版本,并且我需要 sqlserver 2008 r2 的安装介质来进行升级? 另外,我需要为新许可证付费吗?
我无法使用 SQL Server Management Studio 连接到 SQL Server。 我有一个连接字符串: 我尝试通过在服务器名中输入 myIP、在登录名中输入 MyID、在密码中
我们希望使用 SQL Server 加密来加密数据库中的几个列。我们还需要在生产和测试环境之间传输数据。看来最好的解决方案是在生产和测试服务器上使用相同的主 key 、证书和对称 key ,以便我可以
有没有可以分析 SQL Server 数据库潜在问题的工具? 例如: a foreign key column that is not indexed 没有 FILL FACTOR 的 uniquei
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
如果您使用 SQL Server 身份验证 (2005),登录详细信息是否以明文形式通过网络发送? 最佳答案 如您所愿,安全无忧... 您可以相当轻松地配置 SSL,如果您没有受信任的证书,如果您强制
我想将数据从一个表复制到不同服务器之间的另一个表。 如果是在同一服务器和不同的数据库中,我使用了以下 SELECT * INTO DB1..TBL1 FROM DB2..TBL1 (to copy w
我希望得到一些帮助,因为我在这个问题上已经被困了 2 天了! 场景:我可以从我的开发计算机(和其他同事)连接到 SERVER\INSTANCE,但无法从另一个 SQL Server 连接。我得到的错误
我正在尝试从我的 SQL 2012 BI 版本建立复制,但我收到一条奇怪的错误消息! "You cannot create a publication from server 'X' because
我是一名优秀的程序员,十分优秀!