- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
Lucene.Net 文档极度缺乏——我一直在努力弄清楚如何使用 Lucene.Net phonetic searching functionality .
我主要引用了 lucene.ne git project PhoneticFilter 的测试用例:https://github.com/apache/lucenenet/blob/master/src/Lucene.Net.Tests.Analysis.Phonetic/TestPhoneticFilter.cs
我如何创建索引:
// add new index entry
Document doc = new Document
{
new TextField("brand", vehicle.Brand ?? string.Empty, Field.Store.YES),
new TextField("range", vehicle.Range ?? string.Empty, Field.Store.YES),
new TextField("model", vehicle.Model ?? string.Empty, Field.Store.YES),
new TextField("year", vehicle.Year ?? string.Empty, Field.Store.YES),
};
// add entry to index
writer.AddDocument(doc);
接下来,来自test case ,看来您可以将 PhoneticFilter
添加到 Analyzer
:
// set up lucene searcher
using DirectoryReader reader = DirectoryReader.Open(Directory);
Analyzer analyzer = Analyzer.NewAnonymous(createComponents: (fieldName, reader) =>
{
Tokenizer tokenizer = new KeywordTokenizer(reader);
return new TokenStreamComponents(tokenizer, new PhoneticFilter(tokenizer, new Soundex(), false));
});
IndexSearcher searcher = new IndexSearcher(reader);
int hits_limit = searchModel.Start + searchModel.Qty;
TopDocs topDocs;
Sort sortOrder = null;
BooleanQuery vehicleFilterQuery = new BooleanQuery();
var brandParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "brand", analyzer);
var brandQuery = ParseQuery(searchModel.SearchTerm, brandParser);
brandQuery.Boost = 4.0f;
vehicleFilterQuery.Add(brandQuery, Occur.SHOULD);
var rangeParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "range", analyzer);
var rangeQuery = ParseQuery(searchModel.SearchTerm, rangeParser);
rangeQuery.Boost = 3.0f;
vehicleFilterQuery.Add(rangeQuery, Occur.SHOULD);
var modelParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "model", analyzer);
var modelQuery = ParseQuery(searchModel.SearchTerm, modelParser);
modelQuery.Boost = 2.0f;
vehicleFilterQuery.Add(modelQuery, Occur.SHOULD);
var yearParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "year", analyzer);
var yearQuery = ParseQuery(searchModel.SearchTerm, yearParser);
yearQuery.Boost = 1.0f;
vehicleFilterQuery.Add(yearQuery, Occur.SHOULD);
topDocs = searcher.Search(vehicleFilterQuery, null, hits_limit, sortOrder ?? Sort.RELEVANCE);
ScoreDoc[] subset = topDocs.ScoreDocs.Skip(searchModel.Start).Take(searchModel.Qty).ToArray();
return MapToModelList(subset, searcher);
为了测试实现这个之后,我用 Audee
搜索,期望得到一堆 Audi
结果,但是当常规(正确拼写)搜索工作时,拼音搜索似乎没有影响。
我试过 Metaphone()
、DoubleMetaphone()
、Soundex()
、RefinedSoundex()
、Caverphone1()
和 Caverphone2()
编码器
DoubleMetaphone https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.DoubleMetaphone.html
RefinedSoundex https://lucenenetdocs.azurewebsites.net/api/Lucene.Net.Analysis/Lucene.Net.Analysis.Phonetic.Language.RefinedSoundex.html
最佳答案
有一个专门的DoubleMetaphoneFilter
专为基本的语音匹配而设计。如果您需要显式控制所使用的语音算法,则只需使用 PhoneticFilter
。
这是一个例子(基于 this StackOverflow answer ):
// Ensures index backward compatibility
const LuceneVersion AppLuceneVersion = LuceneVersion.LUCENE_48;
[Test]
public void DoubleMetaphoneExample()
{
// Create a directory
var directory = new RAMDirectory();
// Create a phonetic analyzer
var analyzer = Analyzer.NewAnonymous(createComponents: (fieldName, reader) => {
var tokenizer = new KeywordTokenizer(input: reader);
var stream = new DoubleMetaphoneFilter(input: tokenizer, maxCodeLength: 8, inject: false);
return new TokenStreamComponents(tokenizer, stream);
});
// Create an index writer
var indexConfig = new IndexWriterConfig(AppLuceneVersion, analyzer);
using (var writer = new IndexWriter(directory, indexConfig))
{
// Add documents
foreach (var vehicle in Vehicles)
{
// add new index entry
Document doc = new Document
{
new TextField("brand", vehicle.Brand ?? string.Empty, Field.Store.YES),
new TextField("range", vehicle.Range ?? string.Empty, Field.Store.YES),
new TextField("model", vehicle.Model ?? string.Empty, Field.Store.YES),
new TextField("year", vehicle.Year ?? string.Empty, Field.Store.YES),
};
// add entry to index
writer.AddDocument(doc);
}
}
// Done indexing
// Begin Search
var searchModel = new { SearchTerm = "audee" };
// Open an IndexReader
using var reader = DirectoryReader.Open(directory);
IndexSearcher searcher = new IndexSearcher(reader);
int hits_limit = 5;
TopDocs topDocs;
Sort sortOrder = null;
BooleanQuery vehicleFilterQuery = new BooleanQuery();
var brandParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "brand", analyzer);
var brandQuery = ParseQuery(searchModel.SearchTerm, brandParser);
brandQuery.Boost = 4.0f;
vehicleFilterQuery.Add(brandQuery, Occur.SHOULD);
var rangeParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "range", analyzer);
var rangeQuery = ParseQuery(searchModel.SearchTerm, rangeParser);
rangeQuery.Boost = 3.0f;
vehicleFilterQuery.Add(rangeQuery, Occur.SHOULD);
var modelParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "model", analyzer);
var modelQuery = ParseQuery(searchModel.SearchTerm, modelParser);
modelQuery.Boost = 2.0f;
vehicleFilterQuery.Add(modelQuery, Occur.SHOULD);
var yearParser = new QueryParser(Lucene.Net.Util.LuceneVersion.LUCENE_48, "year", analyzer);
var yearQuery = ParseQuery(searchModel.SearchTerm, yearParser);
yearQuery.Boost = 1.0f;
vehicleFilterQuery.Add(yearQuery, Occur.SHOULD);
topDocs = searcher.Search(vehicleFilterQuery, null, hits_limit, sortOrder ?? Sort.RELEVANCE);
// topDocs.ScoreDocs contains
// doc = 2
// doc = 3
// doc = 4
// doc = 7
}
private static Search.Query ParseQuery(string searchTerm, QueryParser queryParser)
{
return queryParser.Parse(searchTerm);
}
private static Vehicle[] Vehicles = new Vehicle[] {
new Vehicle { Brand = "Ford", Model = "Taurus", Year = "1986" },
new Vehicle { Brand = "Ford", Model = "Fiesta", Year = "1990" },
new Vehicle { Brand = "Audi", Model = "A4 45", Year = "2021" },
new Vehicle { Brand = "Audi", Model = "Q3 45 S", Year = "2021" },
new Vehicle { Brand = "Audie", Model = "Q3 45 S", Year = "2021" },
new Vehicle { Brand = "Toyota", Model = "Corolla", Year = "2010" },
new Vehicle { Brand = "Toyota", Model = "Hilux", Year = "2015" },
new Vehicle { Brand = "Audi", Model = "A4", Year = "2017" },
};
public class Vehicle
{
public string Brand { get; set; }
public string Range { get; set; }
public string Model { get; set; }
public string Year { get; set; }
}
或者,您可以使用 PhoneticFilter
来选择算法。我用 DoubleMetaphone
尝试了您的示例(设置和不设置 MaxCodeLen
)并且效果很好。
var stream = new PhoneticFilter(
input: tokenizer,
encoder: new DoubleMetaphone() { MaxCodeLen = 8 },
inject: false);
有一些关于 phonetic algorithms 的一般信息在维基百科上。在大多数情况下,Double Metaphone 是英语语言的最佳选择。
关于c# - Lucene.Net拼音搜索怎么用,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/60654369/
#include using namespace std; class C{ private: int value; public: C(){ value = 0;
这个问题已经有答案了: What is the difference between char a[] = ?string?; and char *p = ?string?;? (8 个回答) 已关闭
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 7 年前。 此帖子已于 8 个月
除了调试之外,是否有任何针对 c、c++ 或 c# 的测试工具,其工作原理类似于将独立函数复制粘贴到某个文本框,然后在其他文本框中输入参数? 最佳答案 也许您会考虑单元测试。我推荐你谷歌测试和谷歌模拟
我想在第二台显示器中移动一个窗口 (HWND)。问题是我尝试了很多方法,例如将分辨率加倍或输入负值,但它永远无法将窗口放在我的第二台显示器上。 关于如何在 C/C++/c# 中执行此操作的任何线索 最
我正在寻找 C/C++/C## 中不同类型 DES 的现有实现。我的运行平台是Windows XP/Vista/7。 我正在尝试编写一个 C# 程序,它将使用 DES 算法进行加密和解密。我需要一些实
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
有没有办法强制将另一个 窗口置于顶部? 不是应用程序的窗口,而是另一个已经在系统上运行的窗口。 (Windows, C/C++/C#) 最佳答案 SetWindowPos(that_window_ha
假设您可以在 C/C++ 或 Csharp 之间做出选择,并且您打算在 Windows 和 Linux 服务器上运行同一服务器的多个实例,那么构建套接字服务器应用程序的最明智选择是什么? 最佳答案 如
你们能告诉我它们之间的区别吗? 顺便问一下,有什么叫C++库或C库的吗? 最佳答案 C++ 标准库 和 C 标准库 是 C++ 和 C 标准定义的库,提供给 C++ 和 C 程序使用。那是那些词的共同
下面的测试代码,我将输出信息放在注释中。我使用的是 gcc 4.8.5 和 Centos 7.2。 #include #include class C { public:
很难说出这里问的是什么。这个问题是含糊的、模糊的、不完整的、过于宽泛的或修辞性的,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开它,visit the help center 。 已关
我的客户将使用名为 annoucement 的结构/类与客户通信。我想我会用 C++ 编写服务器。会有很多不同的类继承annoucement。我的问题是通过网络将这些类发送给客户端 我想也许我应该使用
我在 C# 中有以下函数: public Matrix ConcatDescriptors(IList> descriptors) { int cols = descriptors[0].Co
我有一个项目要编写一个函数来对某些数据执行某些操作。我可以用 C/C++ 编写代码,但我不想与雇主共享该函数的代码。相反,我只想让他有权在他自己的代码中调用该函数。是否可以?我想到了这两种方法 - 在
我使用的是编写糟糕的第 3 方 (C/C++) Api。我从托管代码(C++/CLI)中使用它。有时会出现“访问冲突错误”。这使整个应用程序崩溃。我知道我无法处理这些错误[如果指针访问非法内存位置等,
关闭。这个问题不符合Stack Overflow guidelines .它目前不接受答案。 我们不允许提问寻求书籍、工具、软件库等的推荐。您可以编辑问题,以便用事实和引用来回答。 关闭 7 年前。
已关闭。此问题不符合Stack Overflow guidelines 。目前不接受答案。 要求我们推荐或查找工具、库或最喜欢的场外资源的问题对于 Stack Overflow 来说是偏离主题的,因为
我有一些 C 代码,将使用 P/Invoke 从 C# 调用。我正在尝试为这个 C 函数定义一个 C# 等效项。 SomeData* DoSomething(); struct SomeData {
这个问题已经有答案了: Why are these constructs using pre and post-increment undefined behavior? (14 个回答) 已关闭 6
我是一名优秀的程序员,十分优秀!