- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
关注
https://github.com/Sitecore/autohaus/blob/master/Autohaus.Custom/Indexing/Analyzers/NGramAnalyzer.cs
我创建了这个自定义分析器
public class NGramAnalyzer : Analyzer
{
private readonly Version _version;
private readonly int _minGram;
private readonly int _maxGram;
public NGramAnalyzer(Version version, int minGram = 2, int maxGram = 8)
{
_version = version;
_minGram = minGram;
_maxGram = maxGram;
}
public override TokenStream TokenStream(string fieldName, TextReader reader)
{
// Splits words at punctuation characters, removing punctuation.
// Splits words at hyphens, unless there's a number in the token...
// Recognizes email addresses and internet hostnames as one token.
var tokenizer = new StandardTokenizer(_version, reader);
TokenStream filter = new StandardFilter(tokenizer);
// Normalizes token text to lower case.
filter = new LowerCaseFilter(filter);
// Removes stop words from a token stream.
filter = new StopFilter(true, filter, StopAnalyzer.ENGLISH_STOP_WORDS_SET);
return new NGramTokenFilter(filter, _minGram, _maxGram);
}
}
我遇到的问题是它以
的形式生成查询[ titleNGram:"his ist sto tor ory" ] instead of [ titleNGram:his ist sto tor ory]
对于[历史]。注意第一个引号
如何让它不引用查询。
我在这里找到了关于 Java Lucene 的类似讨论
https://forum.hibernate.org/viewtopic.php?f=9&t=999916&view=next
有没有一种方法可以解决这个问题而不导致解决方法。
我正在使用 PerFieldAnalyzerWrapper,使用变通方法似乎不会很干净。
感谢任何帮助
最佳答案
我想在我自己的自动完成实现中使用 NGramAnalyzer
,这是生成我正在寻找的我能找到的东西的唯一尝试,所以这就是我开始的地方。
我遇到了您描述的相同问题,并且想出了一个相当干净的解决方法。
原因似乎在 QueryParser.cs:494 处的 Query GetFieldQuery(String field, String queryText)
中。这最终被称为 QueryParser.Parse
的一部分。如果有多个标记要添加到查询中(“his”、“ist”等等是多个标记)并且名为 severalTokensAtSamePosition
的 bool 值是 false,则 GetFieldQuery
构造一个短语查询(第 677 行)并在返回之前将所有标记添加到其中(第 705 行)。
我们想要的是将所有标记添加到 bool 查询中,使用 Occur.SHOULD
。我试图继承 QueryParser
并覆盖 GetFieldQuery
,因为它被标记为 virtual
。但是,我需要复制其余的功能,并且发现有很多对 private
变量的引用。相反,我想出了如何从解析的查询中提取标记并将它们插入到 BooleanQuery
中,然后再运行搜索:
var query = new BooleanQuery();
foreach( var word in terms ) {
var parsed = parser.Parse( word );
var extractedTerms = new HashSet<Term>();
parsed.ExtractTerms( extractedTerms );
foreach( var term in extractedTerms ) {
query.Add( new TermQuery( term ), Occur.SHOULD );
}
}
var resultDocs = searcher.Search( query, maxResults ).ScoreDocs;
这似乎可行。我仍在努力确定 minGram
和 maxGram
的最佳值,以及处理长度小于 minGram
的术语的最佳方法, 但这是一个好的开始。
关于c# - Lucene.Net NGramAnalyzer 使用引用的 ngram 生成查询,例如 [ titleNGram :"his ist sto tor ory"] 而不是 [ titleNGram :his ist sto tor ory],我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/23793262/
这个问题在这里已经有了答案: 关闭 10 年前。 Possible Duplicate: template pass by value or const reference or…? 以下对于将函数
我用相同的参数列表重载了一个运算符两次。但返回类型不同: T& operator()(par_list){blablabla} const T& operator()(par_list){bla
假设我有实现接口(interface) I 的 Activity A。我的 ViewModel 类 (VM) 持有对实现接口(interface) I 的对象的引用: class A extends
PHP 如何解释 &$this ?为什么允许? 我遇到了以下问题,这看起来像是 PHP 7.1 和 7.2 中的错误。它与 &$this 引用和跨命名空间调用以及 call_user_func_arr
谁能解释一下下面“&”的作用: class TEST { } $abc =& new TEST(); 我知道这是引用。但是有人可以说明我为什么以及什么时候需要这样的东西吗?或者给我指向一个对此有很好解
引用变量是一个别名,也就是说,它是某个已存在变量的另一个名字。一旦把引用初始化为某个变量,就可以使用该引用名称或变量名称来指向变量。 C++ 引用 vs 指针 引用很容易与指针混淆,它们之间有三
目录 引言 背景 结论 引言 我选择写C++中的引用是因为我感觉大多数人误解了引用。而我之所以有这个感受是因为我主持过很多C++的面试,并且我很少
Perl 中的引用是指一个标量类型可以指向变量、数组、哈希表(也叫关联数组)甚至函数,可以应用在程序的任何地方 创建引用 定义变量的时候,在变量名前面加个 \,就得到了这个变量的一个引用 $sc
我编写了一个将从主脚本加载的 Perl 模块。该模块使用在主脚本中定义的子程序(我不是维护者)。 对于主脚本中的一个子例程,需要扩展,但我不想修补主脚本。相反,我想覆盖我的模块中的函数并保存对原始子例
我花了几个小时试图掌握 F# Quotations,但我遇到了一些障碍。我的要求是从可区分的联合类型中取出简单的函数(只是整数、+、-、/、*)并生成一个表达式树,最终将用于生成 C 代码。我知道使用
很多时候,问题(尤其是那些标记为 regex 的问题)询问验证密码的方法。似乎用户通常会寻求密码验证方法,包括确保密码包含特定字符、匹配特定模式和/或遵守最少字符数。这篇文章旨在帮助用户找到合适的密码
我想通过 MIN 函数内的地址(例如,C800)引用包含文本的最后一个单元格。你能帮忙吗? Sub Set_Formula() ' ----------------------------- Dim
使用常规的 for 循环,我可以做类似的事情: for (let i = 0; i < objects.length; i++) { delete objects[i]; } 常规的 for-
在 Cucumber 中,您定义了定义 BDD 语法的步骤;例如,您的测试可能有: When I navigate to step 3 然后你可以定义一个步骤: When /^I navigate t
这是什么UnaryExpression的目的,以及应该怎样使用? 最佳答案 它需要一个 Expression对象并用另一个 Expression 包裹它.例如,如果您有一个用于 lambda 的表达式
给出以下内容 $("#identifier div:first, #idetifier2").fadeOut(300,function() { // I need to reference jus
我不知道我要找的东西的正确术语,但我要找的是一个完整的引用,可以放在双引号之间的语句,比如 *, node()、@* 以及所有列出的 here加上任何其他存在的。 我链接到的答案提供了一些细节,但还
This question's answers are a community effort。编辑现有答案以改善此职位。它当前不接受新的答案或互动。 这是什么? 这是常见问答的集合。这也是一个社区Wi
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。 想改善这个问题吗?更新问题,以便将其作为on-topic
考虑下一个代码: fn get_ref(slice: &'a Vec, f: fn(&'a Vec) -> R) -> R where R: 'a, { f(slice) } fn m
我是一名优秀的程序员,十分优秀!