- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个数据库,其中的字段可以包含长短语。我希望能够在这些列中快速搜索关键字或短语,但是在搜索短语时,我希望能够像 Google 一样搜索该短语,返回包含所有指定单词的所有行,但不特定彼此之间的秩序或“接近”。此时无需按相关性对结果进行排名。
阅读有关 SQL Server 的 Full-Text Search 后,我认为这正是我所需要的:基于文本列中每个单词的可搜索索引。我的最终目标是安全地接受用户输入并将其转换为利用全文搜索速度的查询,同时保持用户的易用性。
我看到 FREETEXT
function可以获取整个短语,将其分解为“有用”的单词(忽略“and”、“or”、“the”等单词),然后非常快速地返回匹配行的列表,即使使用复杂的搜索词。但当您尝试使用它时,您可能会注意到,它似乎只执行 OR
搜索,而不是对每个术语进行 AND
搜索。也许有一种方法可以改变它的行为,但我还没有发现任何有用的东西。
然后是CONTAINS
,它可以接受 bool 查询短语,但有时会产生奇怪的结果。
查看此表中的以下查询:
PKID Name
----- -----
1 James Kirk
2 James Cameron
3 Kirk Cameron
4 Kirk For Cameron
Q1: SELECT Name FROM tblName WHERE FREETEXT(Name, 'james')
Q2: SELECT Name FROM tblName WHERE FREETEXT(Name, 'james kirk')
Q3: SELECT Name FROM tblName WHERE FREETEXT(Name, 'kirk for cameron')
Q4: SELECT Name FROM tblName WHERE CONTAINS(Name, 'james')
Q5: SELECT Name FROM tblName WHERE CONTAINS(Name, '"james kirk"')
Q6: SELECT Name FROM tblName WHERE CONTAINS(Name, '"kirk james"')
Q7: SELECT Name FROM tblName WHERE CONTAINS(Name, 'james AND kirk')
Q8: SELECT Name FROM tblName WHERE CONTAINS(Name, 'kirk AND for AND cameron')
SELECT Name FROM tblName WHERE FREETEXT(Name, 'james')
返回“詹姆斯·柯克”和“詹姆斯·卡梅隆”。好吧,让我们缩小范围......
SELECT Name FROM tblName WHERE FREETEXT(Name, 'james kirk')
你猜怎么着。现在您将获得“詹姆斯·柯克”、“詹姆斯·卡梅隆”和“卡梅隆的柯克”。 查询 3 也会发生同样的情况,所以我们跳过它。
SELECT Name FROM tblName WHERE CONTAINS(Name, 'james')
与查询 1 的结果相同。好的。也许缩小结果范围...?
SELECT Name FROM tblName WHERE CONTAINS(Name, '"james kirk"')
发现如果有空格,您需要将字符串括在双引号中,我发现此查询在这个特定数据集上效果很好,可以得到我想要的结果!仅返回“James Kirk”。精彩的!或者说是……
SELECT Name FROM tblName WHERE CONTAINS(Name, '"kirk james"')
废话。不。它与该短语完全匹配。嗯......检查后syntax for T-SQL's CONTAINS function ,我发现您可以在其中添加 bool 关键字,看起来这可能就是答案。让我们看看...
SELECT Name FROM tblName WHERE CONTAINS(Name, 'james AND kirk')
整洁。正如预期的那样,我得到了所有三个结果。现在我只是编写一个函数来将单词 AND
填充在所有单词之间。完成了,对吧?现在怎么办...
SELECT Name FROM tblName WHERE CONTAINS(Name, 'kirk AND for AND cameron')
这个查询确切地知道它在寻找什么,除了某些原因之外,没有任何结果。为什么?阅读完关于 Stopwords and Stoplists 后, ,我会做出有根据的猜测并说,因为我要求“kirk”、“for”和“cameron”的索引结果的交集,而单词“for”不会有任何结果(什么与它是一个停用词等),那么与该结果的任何交集的结果也是空的。它是否真的起到这样的作用与我无关,因为这是每次我使用其中的停用词进行 bool 搜索时 CONTAINS
函数的可观察行为。
所以我需要一个新的解决方案。
NEAR
看起来很有希望。如果我可以接受用户查询并在其之间放置逗号,这将...等等,这与在 CONTAINS
查询中使用 bool AND
是一样的。但它是否正确忽略停用词?
SELECT Name FROM tblName WHERE CONTAINS(Name, 'NEAR(kirk, for, cameron)')
不。没有结果。删除“for”一词,您将再次获得所有三个结果。 :(
最佳答案
我找到了another question on here涉及同一主题。事实上,详细介绍该方法的帖子甚至标题为“A Google-like Full Text Search”。它使用名为 Irony 的开源库解析用户输入的搜索字符串并将其转换为与 FTS 兼容的查询。
这是source code for the latest version类似 Google 的全文搜索。
关于sql - 如何使用 T-SQL 全文搜索来获得像 Google 一样的结果?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23816039/
我对这个错误很困惑: Cannot implicitly convert type 'System.Func [c:\Program Files (x86)\Reference Assemblies\
考虑这段代码: pub trait Hello { fn hello(&self); } impl Hello for Any { fn hello(&self) {
问题很简单。是否可以构造这样一个类型 T,对于它下面的两个变量声明会产生不同的结果? T t1 = {}; T t2{}; 我已经研究 cppreference 和标准一个多小时了,我了解以下内容:
Intellij idea 给我这个错误:“Compare (T, T) in Comparator cannot be applied to (T, T)” 对于以下代码: public class
任何人都可以告诉我 : n\t\t\t\t\n\t\t\t 在以下来自和 dwr 服务的响应中的含义和用途是什么. \r\n\t\t\t \r\n\t\t\t
让 T 成为一个 C++ 类。 下面三个指令在行为上有什么区别吗? T a; T a(); T a = T(); T 为不带参数的构造函数提供了显式定义这一事实是否对问题有任何改变? 后续问题:如果
Rust中的智能指针是什么 智能指针(smart pointers)是一类数据结构,是拥有数据所有权和额外功能的指针。是指针的进一步发展 指针(pointer)是一个包含内存地
比如我有一个 vector vector > v={{true,1},{true,2},{false,3},{false,4},{false,5},{true,6},{false,7},{true,8
我有一个来自 .xls 电子表格的数据框,我打印了 print(df.columns.values) 列,输出包含一个名为:Poll Responses\n\t\t\t\t\t。 我查看了 Excel
This question already has answers here: What are good reasons for choosing invariance in an API like
指针类型作为类型前缀与在类型前加斜杠作为后缀有什么区别。斜线到底是什么意思? 最佳答案 语法 T/~ 和 T/& 基本上已被弃用(我什至不确定编译器是否仍然接受它)。在向新向量方案过渡的初始阶段,[T
我正在尝试找到一种方法来获取模板参数的基类。 考虑以下类: template class Foo { public: Foo(){}; ~Foo(){};
这是一个让我感到困惑的小问题。我不知道如何描述它,所以只看下面的代码: struct B { B() {} B(B&) { std::cout ::value #include
为什么有 T::T(T&) 而 T::T(const T&) 更适合 copy ? (大概是用来实现move语义的???) 原始描述(被melpomene证明是错误的): 在C++11中,支持了一种新
在 Java 7 中使用 eclipse 4.2 并尝试实现 List 接口(interface)的以下方法时,我收到了警告。 public T[] toArray(T[] a) { ret
假设有三个函数: def foo[T](a:T, b:T): T = a def test1 = foo(1, "2") def test2 = foo(List(), ListBuffer()) 虽
我对柯里化(Currying)和非柯里化(Currying)泛型函数之间类型检查的差异有点困惑: scala> def x[T](a: T, b: T) = (a == b) x: [T](a: T,
考虑一个类A,我如何编写一个具有与相同行为的模板 A& pretty(A& x) { /* make x pretty */ return x; } A pretty(A&& x) {
Eclipse 表示由于泛型类型橡皮擦,类型参数不允许使用 instanceof 操作。 我同意在运行时不会保留任何类型信息。但是请考虑以下类的通用声明: class SomeClass{ T
在 C++14 中: 对于任何整数或枚举类型 T 以及对于任何表达式 expr: 有没有区别: struct S { T t { expr }; }; 和 struct S { T t = { exp
我是一名优秀的程序员,十分优秀!