基于ASP.NET的lucene.net全文搜索实现步骤-6ren

基于ASP.NET的lucene.net全文搜索实现步骤

转载作者：qq735679552 更新时间：2022-09-29 22:32:09

CFSDN坚持开源创造价值，我们致力于搭建一个资源共享平台，让每一个IT人在这里找到属于你的精彩世界.

这篇CFSDN的博客文章基于ASP.NET的lucene.net全文搜索实现步骤由作者收集整理，如果你对这篇文章有兴趣，记得点赞哟.

在做项目的时候，需求添加全文搜索，选择了lucene.net方向，调研了一下，基本实现了需求，现在将它分享给大家。理解不深请多多包涵.

在完成需求的时候，查看的大量的资料，本文不介绍详细的lucene.net工程建立，只介绍如何对文档进行全文搜索。对于如何建立lucene.net的工程请大家访问。

使用lucene.net搜索分为两个部分，首先是创建索引，创建文本内容的索引，其次是根据创建的索引进行搜索。那么如何对文档进行索引呢，主要是对文档的内容进行索引，关键是提取出文档的内容，按照常规实现，由简到难，提取txt格式的文本相对比较简单，如果实现了提取txt文本，接下来就容易多了，万丈高楼平地起，这就是地基.

1.首先创建ASP.NET页面.

基于ASP.NET的lucene.net全文搜索实现步骤

这是一个极其简单的页面，创建页面之后，双击各个按钮生成相应的点击事件，在相应的点击事件中实现程序设计.

2.实现索引部分.

前面已经说到了，索引主要是根据文本内容建立索引，所以要提取文本内容。创建提取txt格式文档文本内容的函数.

复制代码代码如下:

    
 //提取txt文件  
 
 public static string FileReaderAll(FileInfo fileName)  
 
 {  
 
 //读取文本内容，并且默认编码格式，防止出现乱码  
 
 StreamReader reader = new StreamReader(fileName.FullName, System.Text.Encoding.Default);  
 
 string line = "";  
 
 string temp = "";  
 
 //循环读取文本内容  
 
 while ((line = reader.ReadLine()) != null)  
 
 {  
 
 temp += line;  
 
 }  
 
 reader.Close();  
 
 //返回字符串，用于lucene.net生成索引  
 
 return temp;  
 
 }

文本内容已经提取出来了，接下来要根据提取的内容建立索引。

复制代码代码如下:

    
 protected void Button2_Click(object sender, EventArgs e)  
 
 {  
 
 //判断存放文本的文件夹是否存在  
 
 if (!System.IO.Directory.Exists(filesDirectory))  
 
 {  
 
 Response.Write("<script>alert('指定的目录不存在');</script>");  
 
 return;  
 
 }  
 
 //读取文件夹内容  
 
 DirectoryInfo dirInfo = new DirectoryInfo(filesDirectory);  
 
 FileInfo[] files = dirInfo.GetFiles("*.*");  
 
 //文件夹判空  
 
 if (files.Count() == 0)  
 
 {  
 
 Response.Write("<script>alert('Files目录下没有文件');</script>");  
 
 return;  
 
 }  
 
 //判断存放索引的文件夹是否存在，不存在创建  
 
 if (!System.IO.Directory.Exists(indexDirectory))  
 
 {  
 
 System.IO.Directory.CreateDirectory(indexDirectory);  
 
 }  
 
 //创建索引  
 
 IndexWriter writer = new IndexWriter(FSDirectory.Open(new DirectoryInfo(indexDirectory)),  
 
 analyzer, true, IndexWriter.MaxFieldLength.LIMITED);  
 
 for (int i = 0; i < files.Count(); i++)  
 
 {  
 
 string str = "";  
 
 FileInfo fileInfo = files[i];  
 
 //判断文件格式，为以后其他文件格式做准备  
 
 if (fileInfo.FullName.EndsWith(".txt") || fileInfo.FullName.EndsWith(".xml"))  
 
 {  
 
 //获取文本  
 
 str = FileReaderAll(fileInfo);  
 
 }  
 
 Lucene.Net.Documents.Document doc = new Lucene.Net.Documents.Document();  
 
 doc.Add(new Lucene.Net.Documents.Field("FileName", fileInfo.Name, Lucene.Net.Documents.Field.Store.YES, Lucene.Net.Documents.Field.Index.ANALYZED));  
 
 //根据文本生成索引  
 
 doc.Add(new Lucene.Net.Documents.Field("Content", str, Lucene.Net.Documents.Field.Store.YES, Lucene.Net.Documents.Field.Index.ANALYZED));  
 
 doc.Add(new Lucene.Net.Documents.Field("Path", fileInfo.FullName, Lucene.Net.Documents.Field.Store.YES, Lucene.Net.Documents.Field.Index.NO));  
 
 //添加生成的索引  
 
 writer.AddDocument(doc);  
 
 writer.Optimize();  
 
 }  
 
 writer.Dispose();  
 
 Response.Write("<script>alert('索引创建成功');</script>");  
 
 }

3.索引创建完了，接下来就是搜索，搜索只要按照固定的格式书写不会出现错误.

复制代码代码如下:

    
 protected void Button1_Click(object sender, EventArgs e)  
 
 {  
 
 //获取关键字  
 
 string keyword = TextBox1.Text.Trim();  
 
 int num = 10;  
 
 //关键字判空  
 
 if (string.IsNullOrEmpty(keyword))  
 
 {  
 
 Response.Write("<script>alert('请输入要查找的关键字');</script>");  
 
 return;  
 
 }  
 
 IndexReader reader = null;  
 
 IndexSearcher searcher = null;  
 
 try  
 
 {  
 
 reader = IndexReader.Open(FSDirectory.Open(new DirectoryInfo(indexDirectory)), true);  
 
 searcher = new IndexSearcher(reader);  
 
 //创建查询  
 
 PerFieldAnalyzerWrapper wrapper = new PerFieldAnalyzerWrapper(analyzer);  
 
 wrapper.AddAnalyzer("FileName", analyzer);  
 
 wrapper.AddAnalyzer("Path", analyzer);  
 
 wrapper.AddAnalyzer("Content", analyzer);  
 
 string[] fields = { "FileName", "Path", "Content" };  
 
 QueryParser parser = new MultiFieldQueryParser(Lucene.Net.Util.Version.LUCENE_30, fields, wrapper);  
 
 //根据关键字查询  
 
 Query query = parser.Parse(keyword);  
 
 TopScoreDocCollector collector = TopScoreDocCollector.Create(num, true);  
 
 searcher.Search(query, collector);  
 
 //这里会根据权重排名查询顺序  
 
 var hits = collector.TopDocs().ScoreDocs;  
 
 int numTotalHits = collector.TotalHits;  
 
 //以后就可以对获取到的collector数据进行操作  
 
 for (int i = 0; i < hits.Count(); i++)  
 
 {  
 
 var hit = hits[i];  
 
 Lucene.Net.Documents.Document doc = searcher.Doc(hit.Doc);  
 
 Lucene.Net.Documents.Field fileNameField = doc.GetField("FileName");  
 
 Lucene.Net.Documents.Field pathField = doc.GetField("Path");  
 
 Lucene.Net.Documents.Field contentField = doc.GetField("Content");  
 
 //在页面循环输出表格  
 
 strTable.Append("<tr>");  
 
 strTable.Append("<td>" + fileNameField.StringValue + "</td>");  
 
 strTable.Append("</tr>");  
 
 strTable.Append("<tr>");  
 
 strTable.Append("<td>" + pathField.StringValue + "</td>");  
 
 strTable.Append("</tr>");  
 
 strTable.Append("<tr>");  
 
 strTable.Append("<td>" + contentField.StringValue.Substring(0, 300) + "</td>");  
 
 strTable.Append("</tr>");  
 
 }  
 
 }  
 
 finally  
 
 {  
 
 if (searcher != null)  
 
 searcher.Dispose();  
 
 if (reader != null)  
 
 reader.Dispose();  
 
 }  
 
 }

现在整个lucene.net搜索全文的过程就建立完了，现在可以搜索txt格式的文件，搜索其他格式的文件在以后添加，主要核心思想就是提取各个不同格式文件的文本内容.

。

显示效果如下:

基于ASP.NET的lucene.net全文搜索实现步骤

在以后的博文里继续接受搜索其他格式的文档.

最后此篇关于基于ASP.NET的lucene.net全文搜索实现步骤的文章就讲到这里了,如果你想了解更多关于基于ASP.NET的lucene.net全文搜索实现步骤的内容请搜索CFSDN的文章或继续浏览相关文章，希望大家以后支持我的博客！。

文章推荐： ASP.NET GridView 实现课程表显示(动态合并单元格)实现步骤

文章推荐：状态保存机制之ViewState概述及应用

文章推荐：透过ashx看浏览器服务器运行本质(图解)

文章推荐： javascript asp教程服务器对象

svn - 搜索颠覆历史(全文)
有没有办法对 Subversion 存储库执行全文搜索，包括所有历史记录？例如，我编写了一个在某处使用过的功能，但后来不需要它，所以我对文件进行了 svn rm'd，但现在我需要再次找到它以将其用于
MySQL - 通过部分单词匹配和相关性评分进行高效搜索(全文)
如何进行 MySQL 搜索，既匹配部分单词，又提供准确的相关性排序？ SELECT name, MATCH(name) AGAINST ('math*' IN BOOLEAN MODE) AS rel
postgresql - 全文 Postgres
我在 postgresql 中创建了一个用于全文搜索的索引。 CREATE INDEX pesquisa_idx ON chamado USING gin(to_tsvector('portugues
Mysql 未对结果进行排名，全文
我已经设置了一个数据库并启用了全文搜索，当我使用以下内容搜索数据库时，数据库中有一些条目包含“测试”一词，还有一个条目包含“测试更多”: SELECT keywords, title FROM dat
具有特定词序的 MySQL 全文
我想知道是否可以进行 MATCH() AGAINST()(全文)搜索，使得不直接相邻的单词需要按特定顺序排列？在我的网站上，当用户在双引号之间键入单词时，搜索将仅显示具有特定顺序的这些单词的结果。例如
MYSQL 全文 - 意外结果
我有一个 80,000 行的数据库，当我测试一些 FULLTEXT 查询时，我遇到了一个意想不到的结果。我已从 MYSQL 中删除停用词并将最小字长设置为 3。当我执行此查询时: SELECT `s
MySQL - 查找部分字符串 - 全文？
我刚刚在我的 MYSQL 数据库中发现了一堆流氓数据... 到达它的唯一方法是通过其中一列 - FILE_PATH，其中包含文件路径的斜杠剥离版本。我需要在这组文件中找到一些恶意文件——它们的文件名都
带词干的 MySQL 全文
我正在为我的站点构建一个小的搜索功能。我正在接受用户的查询，提取关键字，然后针对提取的关键字运行全文 MySQL 搜索。问题在于 MySQL 将词干视为文字。这是正在发生的过程: 用户搜索“棒球”之
database - (全文)搜索与数据库设计
这是一个关于使用(关系)数据库设计全文搜索的系统架构问题。我使用的具体软件是 Solr 和 PostgreSQL，仅供引用。假设我们正在构建一个有两个用户 Andy 和 Betty 的论坛 -- P
元素数组中的数组上的 MongoDB 全文
当元素数组中的数组包含应与我的搜索匹配的文本时，我无法检索文档。这里有两个示例文档: { _id: ..., 'foo': [ { 'name
mysql - 全文 : this query very slow
我正在使用这个查询，但不幸的是它运行缓慢: SELECT *, (MATCH(`title`) AGAINST ('$word' IN BOOLEAN MODE) * 2 + MATC
php - Mysql(全文？)搜索产品
我正在构建一个非常简单的产品目录，它将在 mysql 表中存储产品，我想尽快搜索产品(并尽可能相关)。产品数据库将非常大(大约 500.000 个产品)，这就是为什么使用“like”而不使用索引的搜索
Mysql 全文、匹配...和搜索字段中的@
select count(distinct email_address) from users WHERE MATCH (email_address) AGAINST ('@r
MySQL 全文 MATCH AGAINST 不适用于复数
我正在尝试在 mySQL 中进行简单的全文搜索，但在复数方面遇到一些问题。我确实相信我符合50% 规则。我不认为我使用了停用词。我正在运行这样的查询: SELECT * FROM product
mysql - 全文 InnoDB 搜索没有响应
我在 innoDB 数据库中使用全文搜索时遇到了一个大问题。首先，ns_pages 表有超过 2.6m 的记录，全文索引有 3 个键 block 。该数据库在具有 128GB RAM 的 Dell
MySQL 全文 : have a result weigh more
我有一个城市和州的数据库(大约 43,000 个)。我对其进行全文搜索，如下所示: select city, state, match(city, state_short, state) agains
Mysql 全文 50% 阈值
我正在使用带有自然语言全文的 Mysql FULLTEXT 搜索，不幸的是，我遇到了 FULLTEXT 50% 阈值，如果给定的关键字出现在总行数的 50% 时间，则不允许我搜索行。我搜索并找到了一
mysql - 全文 mysql 搜索不起作用
如果我搜索单词hello，那么我没有匹配到，而我搜索单词hella，那么我得到了匹配。同样的情况也发生在“Non”这个词上。我在 Mac 上的 MAMP 和 sqlfiddle.com 上进行了测试，
Postgresql 全文(pg_trgm)更好地处理精确匹配？
所以我有一个简单的场景。我有一张 field 表(事件 field 等)。我的查询看起来像: SELECT * FROM venues WHERE venues.name % 'Philips Are
MySQL 全文(非)搜索
我有一个表，其中有视频数据，如“标题”、“描述”等。我正在尝试使用 MySQL 全文索引编写一个搜索引擎。 SQL 查询适用于某些单词，但不是每个单词。这是我的 SQL 查询； SELECT * FR

qq735679552

个人简介

我是一名优秀的程序员,十分优秀！

作者热门文章

滴滴打车优惠券免费领取

全站热门文章

首页

博学

6Ren·AI

商城

基于ASP.NET的lucene.net全文搜索实现步骤