c# - 如何在 Lucene.Net 中使用 Whitespaceanalyzer 和 LowerCase 过滤器创建自己的分析器？-6ren

c# - 如何在 Lucene.Net 中使用 Whitespaceanalyzer 和 LowerCase 过滤器创建自己的分析器？

转载作者：行者123 更新时间：2023-11-30 20:01:53

27

4

在我的例子中，我需要搜索像 C#、.Net、C++.. 等关键字，其中标准分析器去除了特殊字符，所以我使用了空白分析器，它对我不起作用。索引时:

public void Indexing(DataSet ds)
{
        string indexFileLocation = @"D:\Lucene.Net\Data";
        Lucene.Net.Store.Directory dir = Lucene.Net.Store.FSDirectory.GetDirectory(indexFileLocation, true);
        IndexWriter indexWriter = new IndexWriter(dir, new WhitespaceAnalyzer(), Lucene.Net.Index.IndexWriter.MaxFieldLength.UNLIMITED);
        if (ds.Tables[0] != null)
        {
            DataTable dt = ds.Tables[0];
            if (dt.Rows.Count > 0)
            {
                foreach (DataRow dr in dt.Rows)
               {
                    //Create the Document object
                    Document doc = new Document();

                    foreach (DataColumn dc in dt.Columns)
                    {
                        string check = dc.ToString();

                        if (check.Equals("Skill_Summary"))
                        {
                            doc.Add(new Field(dc.ColumnName, dr[dc.ColumnName].ToString(), Field.Store.YES, Field.Index.ANALYZED));
                        }
                        if (check.Equals("Title"))
                        {
                            doc.Add(new Field(dc.ColumnName, dr[dc.ColumnName].ToString(), Field.Store.YES, Field.Index.ANALYZED));
                        }
                    }
                    // Write the Document to the catalog
                    indexWriter.AddDocument(doc);
                }
            }
        }
        // Close the writer
        indexWriter.Close();
    }

并像这样搜索字段:

string[] searchfields = new string[] { "Skill_Summary", "Title" };
var parser = new MultiFieldQueryParser(Lucene.Net.Util.Version.LUCENE_29, searchfields, new WhitespaceAnalyzer());
string searchText = "C#";

//Split the search string into separate search terms by word
string[] terms = searchText.Split(new[] { " " }, StringSplitOptions.RemoveEmptyEntries);
foreach (string term in terms)
{
    finalQuery.Add(parser.Parse(term.Replace("*", "") + "*"), BooleanClause.Occur.MUST);
}
hits = searcher.Search(finalQuery);

在我的案例中，如何使用 Whitespaceanalyzer 和 LowerCase 过滤器构建自己的分析器？

最佳答案

how to build own analyzer using Whitespaceanalyzer and LowerCase filter in my case?.

public class CaseInsensitiveWhitespaceAnalyzer : Analyzer
{
    /// <summary>
    /// </summary>
    public override TokenStream TokenStream(string fieldName, TextReader reader)
    {
        TokenStream t = null;
        t = new WhitespaceTokenizer(reader);
        t = new LowerCaseFilter(t);

        return t;
    }
}

PS:当您使用通配符(?,*) 时，查询解析器不使用任何分析器，只是小写形式的您的术语(取决于 QueryParser.LowercaseExpandedTerms 的值)

关于c# - 如何在 Lucene.Net 中使用 Whitespaceanalyzer 和 LowerCase 过滤器创建自己的分析器？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/17895537/

27

4

0

文章推荐： c# - 无法执行简单的方法调用

文章推荐： c - 函数的存储分配

文章推荐： c# - 如何将 List 或 List 分配给 List

文章推荐： C - 打印数组中的值错误

.net - asp.net 应用程序的最终用户是否需要安装 .net
创建使用.NET框架的asp.net页面时，访问该页面的客户端是否需要在其计算机上安装.NET框架？ IE。用户访问www.fakesite.com/default.aspx，如果他们没有安装框架，他
.net - 在线程之间正确共享变量 (.NET/VB.NET)
我阅读了很多不同的博客和 StackOverflow 问题，试图找到我的问题的答案，但最后我找不到任何东西，所以我想自己问这个问题。我正在构建一个应用程序，其中有一个长时间运行的工作线程，它执行一些
.net - 为什么.NET 被称为.NET？
已锁定。这个问题及其答案是locked因为这个问题是题外话，但却具有历史意义。目前不接受新的答案或互动。我一直想知道为什么微软为这样一个伟大的平台选择了一个如此奇怪的、对搜索引擎不友好的名称。他们就
.Net Framework .Net .NET Standard的概念及区别
.Net Framework .Net .NET Standard的区别 1、.NET Framework 在未来.NET Framework或许成为过去时，目前还是有很多地方在使用的。这一套
.net - ASP.NET Webforms + ASP.NET Ajax与ASP.NET MVC和Ajax框架的自由
如果有选择的话，您会走哪条路？ ASP.NET Webforms + ASP.NET AJAX 或 ASP.NET MVC + JavaScript Framework of your Choice
asp.net - .net asp.net 网络应用试图连接到 crl.verisign.net
我有一个 Web 服务，它通过专用连接通过 https 使用第三方 Web 服务，我应用了 ServicePointManager.ServerCertificateValidationCallbac
asp.net - ASP.NET Web应用程序(.NET Framework)与ASP.NET Core Web应用程序(.NET Framework)
为什么我应该选择ASP.NET Web Application (.NET Framework)而不是ASP.NET Core Web Application (.NET Framework)？我在
.NET Standard、.NET Core 和 .NET Framework 项目解决方案的 .NET 命名约定
我在网络上没有找到任何关于包含 .NET Standard、.NET Core 和 .NET Framework 项目的 .NET 解决方案的公认命名约定。就我而言，我们在 .NET 框架项目中有以
.net - .NET Compact 是 .NET 的完美子集吗？
.NET Compact 是 .NET 的完美子集吗？假设我考虑了屏幕大小和其他限制并避免了 .NET Compact 不支持的类和方法，或者 .NET Compact 是一个不同且不兼容的 GUI
.net - .NET connectionManagement 配置设置是否适用于所有 .Net 应用程序？
我已经阅读了所有我能找到的关于 connectionManagement 中的 maxconnection 设置的文章:即 http://support.microsoft.com/kb/821268
.net - Asp.net MVC json或Json.net？
我现在正在使用asp.net mvc，想知道使用内置的Json或 Json.Net哪个是更好的选择，但我不确定一个人是否比另一个人有优势。另外，如果我确实选择沿用Json.Net的路线，那么我应该选
.net - .NET Core 和 .NET 标准类库项目类型之间有什么区别？
在 Visual Studio 中，您至少可以创建三种不同类型的类库: 类库(.NET Framework) 类库(.NET 标准) 类库(.NET Core) 虽然第一个是我们多年来一直使用的，但我
.net - .NET 和 ASP.NET 有什么区别
.NET 和 ASP.NET 之间有什么区别？它们有什么关系？最佳答案 ASP.Net 基于 .Net 框架构建，提供有关 Web 开发的附加功能。你可以去看看wikipedia article
.net - 在安装新的 .net 框架之前安装以前的 .net 框架吗？
在安装更高版本(3.0)之前，我需要安装.net框架1.1和2.0吗？或者单独安装 3.0 框架就足够了，并为在早期框架版本上编写的软件提供支持？谢谢，丽然最佳答案不，您不必安装以前的框架。我
asp.net - 获取文本框的先前值asp.net vb.net
我正在开发一个项目，人们可以“更新”类别，例如更改类别的名称。我收到以下消息 This is called after clicking update 按钮 with the SQL statemen
.net - .NET System.Net.CookieContainer 线程安全吗？
.NET 类 System.Net.CookieContainer 线程安全吗？ --更新:交 key 答复-- 是否有任何方法可以确保异步请求期间修改的变量(即 HttpWebRequest.Coo
.net - JScript.NET 能否区分不同的.NET 异常类型
我正在使用 JScript.NET 在我编写的 C# WinForms 应用程序中编写脚本。它工作得很好，但我只是尝试在脚本中放置一些异常处理，但我无法弄清楚如何判断我的 C# 代码抛出了哪种类型的异
.net - ASP.NET VB - .NET 的一些数学运算
我需要你的帮助，比如我有一个小数类型的变量，我想这样取整。例如 3.0 = 3 3.1 = 4 3.2 = 4 3.3 = 4 3.4 = 4 3.5 = 4 3.6 = 4 3.7 = 4 3.
.net - ADO.NET 是在 .net 中访问数据库的唯一本地方式吗？
我使用过这样的代码:http://msdn.microsoft.com/en-us/library/dw70f090.aspx在 ASP.NET 中工作之前访问数据库(2-3 年前)。我没有意识到我正
asp.net - 如何在 .NET Framework、.NET Standard 和 .NET Core 项目之间使用相同的配置？
自 ConfigurationManager .NET Standard 中不存在，检索正在执行的程序集的应用程序设置的最佳方法是什么，无论是 web.config或 appSettings.{env

首页

博学

6Ren·AI

商城

c# - 如何在 Lucene.Net 中使用 Whitespaceanalyzer 和 LowerCase 过滤器创建自己的分析器？