- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想搜索一些带有停用词的短语,例如“Line Through Crack”。 “通过”是停止词。我想得到与查询相同的结果
CONTAINS(*, 'FORMSOF(INFLECTIONAL, "Line") AND FORMSOF(INFLECTIONAL, "Crack")')
因此所有行包含除停用词之外的所有词的所有形式。如果客户不知道停用词列表,我可以这样做吗?
最佳答案
您使用的是什么版本的 SQL Server?如果是 2008 年或更高版本,则您可以在查询运行时以编程方式检索停用词列表。然后,您可以检查是否有任何搜索词在停用词列表中,并将它们从“CONTAINS”查询字符串中排除。
以下查询将返回停用词列表(对于美国英语,语言 ID 为 1033):
-- Run the following to get a list of languages and their IDs
select lcid, name from sys.syslanguages order by 1
-- Then use that ID to get a list of stop words
select * from sys.fulltext_stopwords where language_id = 1033
根据这些信息,您可以编写一个搜索过程来执行类似的操作(这是一个非常基本的示例,但您应该明白了):
USE [AdventureWorks]
GO
-- Make sure you have a full-text catalogue to test against
/*
IF EXISTS(SELECT * FROM sys.fulltext_indexes WHERE [object_id] = OBJECT_ID('Production.ProductDescription'))
DROP FULLTEXT INDEX ON Production.ProductDescription;
IF EXISTS(SELECT * FROM sys.fulltext_catalogs WHERE name = 'FTC_product_description')
DROP FULLTEXT CATALOG FTC_product_description;
CREATE FULLTEXT CATALOG [FTC_product_description]
WITH ACCENT_SENSITIVITY = OFF
AS DEFAULT AUTHORIZATION [dbo]
CREATE FULLTEXT INDEX ON [Production].[ProductDescription]([Description] LANGUAGE [English])
KEY INDEX [PK_ProductDescription_ProductDescriptionID] ON ([FTC_product_description], FILEGROUP [PRIMARY])
WITH (CHANGE_TRACKING = AUTO, STOPLIST = SYSTEM);
*/
GO
IF OBJECT_ID('dbo.my_search_proc') IS NULL EXEC ('CREATE PROC dbo.my_search_proc AS ');
GO
-- My Search Proc
ALTER PROC dbo.my_search_proc (
@query_string NVARCHAR(1000),
@language_id INT = 1033 -- change this to whatever your default language ID is
) AS
BEGIN
SET NOCOUNT ON;
------------------------------------------------------
-- Split the string into 1 row per word
------------------------------------------------------
-- I've done this in-line here for simplicity, but I
-- would recommend creating a CLR function instead
-- for performance reasons.
DECLARE @words TABLE (id INT IDENTITY(1,1), word NVARCHAR(100));
DECLARE @cnt INT, @split_on CHAR(1)
SELECT @cnt = 1, @split_on = ' ';
WHILE (CHARINDEX(@split_on, @query_string) > 0)
BEGIN
INSERT INTO @words (word)
SELECT word = LEFT(LTRIM(RTRIM(SUBSTRING(@query_string,1,CHARINDEX(@split_on,@query_string)-1))), 100);
SET @query_string = SUBSTRING(@query_string,CHARINDEX(@split_on,@query_string)+1,LEN(@query_string));
SET @cnt = @cnt + 1;
END
INSERT INTO @words (word)
SELECT word = LEFT(LTRIM(RTRIM(@query_string)), 100);
------------------------------------------------------
-- Now build your "FORMSOF" string, excluding stop words.
------------------------------------------------------
DECLARE @formsof NVARCHAR(4000);
SELECT @formsof = ISNULL(@formsof, '')
+ 'FORMSOF(INFLECTIONAL, "' + w.word + '") AND '
FROM @words AS w
LEFT JOIN sys.fulltext_system_stopwords AS sw -- use sys.fulltext_stopwords instead if you're using a user-defined stop-word list (or use both)
ON w.word = sw.stopword COLLATE database_default
AND sw.language_id = @language_id
WHERE sw.stopword IS NULL
ORDER BY w.id; -- retain original order in case you do any weighting based on position, etc.
-- If nothing was returned, then the whole query string was made up of stop-words,
-- so just return an empty result set to the application.
IF @@ROWCOUNT = 0
SELECT TOP(0) * FROM Production.ProductDescription;
SET @formsof = LEFT(@formsof, LEN(@formsof)-4); -- Remove the last "AND"
PRINT 'Query String: ' + @formsof
------------------------------------------------------
-- Now perform the actual Full-Text search
------------------------------------------------------
SELECT *
FROM Production.ProductDescription
WHERE CONTAINS(*, @formsof);
END
GO
EXEC dbo.my_search_proc 'bars for downhill';
因此,如果您搜索“bars for downhill”,那么“for”将被删除(因为它是一个停用词),您应该得到 FORMSOF(INFLECTIONAL, "bars") AND FORMSOF(INFLECTIONAL,“下坡”)。
不幸的是,如果您使用的是 SQL 2005 并且不知道干扰词文件中有什么,那么您无能为力(据我所知)。
干杯,戴夫
关于SQL Server Full Text Search Condition for FORMSOF for phrase 排除停用词,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8984639/
现在我已经创建了一个额外的跨度来容纳一个条件。 568 || subKey == 0" ng-repeat="links in linksWrap.links">
一些 excel IF 语句可能会变得相当长,我正在寻找一种更简单的方法来编写它们。例如,如果我要写: If($B$4+13=7,$B$4+13,FALSE) 我认为它会更容易说: If($B$4+1
我有一个包含 FromDate 、 ToDate 、 VendorName 和 GoodsName 的表单,一旦一切为真,我需要显示结果 示例: FromDate="11/20/2019"、ToDat
我经常看到使用 !!condition 而不仅仅是常规条件的代码。即: if(!!value){ doSomething(); } 对比: if(value){ doSomething
这个问题有点模棱两可,这两个在汇编代码/性能方面是否等效: public void example{ do{ //some statements; if(condition)
在我看到的使用 Any 方法的 Linq 查询示例中,大约有一半是通过将其应用于 Where() 调用的结果来实现的,另一半则直接将其应用于集合。这两种样式是否总是等效的,或者在某些情况下它们可能会返
这个问题在这里已经有了答案: What does !!(x) mean in C (esp. the Linux kernel)? (3 个答案) 关闭 9 年前。 我见过人们使用带有两个 '!'
我对部署在生产环境中的应用程序进行了线程转储,该应用程序使用 logback。我不是分析线程转储的专家,但是,我必须这样做。正在学习,网上也看了一些文章。 下面是真正的线程转储: "logback-8
在 SQL 中(特别是 Postgres): 子句 where not foo='bar' in case foo is null 评估为某种 null,导致该行不是包含在结果中。 另一方面,子句 w
是不是类似于has and condition with join和where condition after join? 例如 对于以下两个查询,它会给我相同的结果吗 1) SELECT COUNT
按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visit the
如果您调用某个函数,并且该函数在发生错误时返回 NULL(例如,想想 malloc() 或 fopen()),两个更好: FILE *fp = fopen(argv[0], "r"); if (fp
我正在使用 Azure 数据工厂 V2,我需要在父检查验证中实现两级检查。例如:如果条件一为真,那么我需要检查条件 2。并且,如果条件 2 为真,则检查条件 3。 这是一种分层检查。当我在父 IF 条
使用 Linq to Entities 有以下区别吗? db.EntityName.Where(a => a.Id == id).FirstOrDefault(); db.EntityName.Fir
我有一种情况,我已经用两种不同的方式解决了,但想知道人们对这些选项的看法,以及他们是否有其他选择...... 系统正在处理数据的“间隔”。 所有数据都分配到一个“区间” 该间隔由事实表 中的“inte
我有包含字段 Amount, Condition1, Condition2 的表格。 例子: Amount Condition1 Condition2 ---------------------
我正在尝试在 Netbeans 中制作一个简单的 MySQL、Java JDBC Web 应用程序。我希望根据当前 session 中的状态变量显示不同的内容。我尝试了以下方法: 首先,我在 .jsp
我想为 postnuke cms 设计一个主题。 并希望在模板文件中使用 css 条件。 postnuke 使用类似 smarty 的标签 .... 所以当我使用 .... 它给出了一些关于标签的错误
我想问一下asyncio.Condition .我对这个概念并不熟悉,但我从学生时代就知道并了解锁、信号量和队列。 我找不到很好的解释或典型的用例,只是 this example .我看了看来源。核心
我想知道如何在不在语句中重做相同查询两次的情况下处理 SQL 比较。这是我要找的: SELECT columnName10, IF( SELECT columnName20 FROM Othe
我是一名优秀的程序员,十分优秀!