gpt4 book ai didi

c# - lucene.net 语音过滤器

转载 作者:太空宇宙 更新时间:2023-11-03 11:16:25 24 4
gpt4 key购买 nike

我正在尝试将文本数据存储到 lucene。

搜索要带拼音!

我应该在哪里添加拼音过滤器?

Lucene.Net.Store.Directory dir =
FSDirectory.Open(new DirectoryInfo(Application.StartupPath + "\\Index"));

IndexReader indexReader = IndexReader.Open(dir, true);
Searcher indexSearch = new IndexSearcher(indexReader);
//IndexReader indexReader = IndexReader.Open(dir, true);
//Searcher indexSearch = new IndexSearcher(indexReader);
Analyzer analyzer = new Lucene.Net.Analysis.De.GermanAnalyzer();

//Analyzer analyzer = new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_29);
var queryParser = new QueryParser(Lucene.Net.Util.Version.LUCENE_29,"content", analyzer);
var query = queryParser.Parse(textBox1.Text+"~0.8");

Console.WriteLine("Searching for: " + query.ToString());
TopDocs resultDocs = indexSearch.Search(query, indexReader.MaxDoc());

Console.WriteLine("Results Found: " + resultDocs.TotalHits)

问候,Ingo

最佳答案

一种方法是实现一个 Analyzer,将其添加到 TokenStream 链中,或者直接使用 TokenStream。

即:

System.IO.TextReader someText = ....;
TokenStream phonetics = new PhoneticFilter(new LowerCaseFilter(new WhitespaceTokenizer(someText )));

PhoneticFilter 替换为您实现的 TokenFilter,并在搜索和索引时使用它。

关于c# - lucene.net 语音过滤器,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/12529126/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com