java - 在 Lucene 中关闭词干提取-6ren

java - 在 Lucene 中关闭词干提取

转载作者：塔克拉玛干更新时间：2023-11-02 08:14:04

25

4

我需要关闭 EnglishAnalyzer 或其他类似分析器(例如 ItalianAnalyzer、ecc..)的词干提取
我正在使用 Lucene 3.6.2，我发现只能指定一个集合不应该使用这个构造函数来阻止的单词: EnglishAnalyzer documentation - stemExclusionSet

我该怎么办？

最佳答案

通常，当您使用特定于语言的分析时，是因为您想要词干提取。 StandardAnalyzer 是一种非常有效的非特定语言分析器，如果您不想进行词干提取的话。

然而，语言分析器还处理了其他一些不错的小细节，所以如果您真的需要从分析器中删除词干分析器，请获取分析器的源代码，并创建您自己的分析器来覆盖 TokenStreamComponents 方法，并删除词干过滤器和相关组件(您通常会找到一个可以删除的 SetKeywordMarkerFilter，因为它只是用于防止对所选标记进行词干提取)，比如:

final CharArraySet defaultStopwords = new ItalianAnalyzer(Version.LUCENE_47).getStopWordSet();

final CharArraySet defaultArticles = CharArraySet.unmodifiableSet(
   new CharArraySet(Version.LUCENE_CURRENT, 
       Arrays.asList(
      "c", "l", "all", "dall", "dell", "nell", "sull", "coll", "pell", 
       "gl", "agl", "dagl", "degl", "negl", "sugl", "un", "m", "t", "s", "v", "d"
       ), true));

Analyzer customItalianAnalyzer = new Analyzer() {
  @Override
  protected TokenStreamComponents createComponents(String fieldName, Reader reader) {
    final Tokenizer source = new StandardTokenizer(Version.LUCENE_47, reader);
    TokenStream result = new StandardFilter(Version.LUCENE_47, source);
    result = new ElisionFilter(result, defaultArticles);
    result = new LowerCaseFilter(Version.LUCENE_47, result);
    result = new StopFilter(Version.LUCENE_47, result, defaultStopwords);
    return new TokenStreamComponents(source, result);
  }
};

请注意，我在此处复制了停用词和省略号集的定义。我还删除了版本检查，因为在您的自定义用法中，您可以指定一个版本，而不是在 if 语句中处理它(这里假设您使用的是 3.2 之后的版本)。

另一种选择是只复制 ItalianAnalyzer 的全部内容，但我认为像这样对它进行一次检查并粗略了解分词器/过滤器链是有益的，所以您可以就您真正希望分析仪执行的操作做出明智的决定。

关于java - 在 Lucene 中关闭词干提取，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/23438438/

25

4

0

文章推荐： ios - 解析 PFUser QueryWithPredicate 不工作

文章推荐： android - 在 ListView/RecyclerView 中使用 EditText 导航(下一步)

文章推荐： ios - 使用RoboVM进行应用内购买的解决方案是什么

文章推荐：安卓工作室 : add virtual folder in gradle

javascript - 关闭 Canvas 导航默认打开/关闭
我正在使用的网站上有一个非 Canvas 导航。关闭 Canvas 导航的默认状态是关闭的，这在移动网站上运行良好，因为您可以打开它并选择您的链接，但在桌面上关闭它并打开它会隐藏用户的信息，我希望它是
swift - 关闭/关闭 NSViewController, macOS
我有一个 NSViewController 是这样连接的: 在底部 viewController 中，我尝试使用 self.dismiss(self) 关闭它，但是，它会产生此错误: [General
javascript - 展开搜索关闭单击“关闭 JQuery”
我昨天制作了一个扩展的 JQuery 搜索框，它的作用就像一个魅力!但是，我在创建一个脚本时遇到问题，当用户单击搜索框时，它会关闭。这是我的 JQuery: function expandSearc
javascript - 关闭 InfoWindow - 关闭 onclick - Google map
我一辈子都无法在 API V3 中一次只显示一个信息窗口。我需要一个在下一次开放之前关闭。还希望在 map 上的任何地方关闭 infoWindow onclick。这是否在初始化函数中？这是我的完整
c++ - Asio 端套接字函数 : cancel, 关闭、关闭、释放
关闭和清理套接字的正确方法是什么？我在辅助线程中运行 io_service，我需要关闭与主线程的连接: void closeConnection() { ioc.post([&socket]
java - 使用 Java + Selenium 关闭(关闭)Chrome 打印预览
我的 Selenium 测试看起来像这样:客户选择金融产品，填写一些必要的数据，并在打印预览中显示条款/协议(protocol)文档(根据本地法律的要求)。打印/关闭打印预览对话框后，客户输入更多数据
android - 将(打开/关闭)按钮添加到(打开/关闭)抽屉导航的 Activity
我目前正在从 android 网站了解 Navigation Drawer，我正在使用他们的示例 http://developer.android.com/training/implementing-
android - 无法在 Android 上启动项目 : Error running adb: adb: failed to run abb_exec. 错误:关闭 adb:写入连接错误:关闭
尝试通过 expo 在模拟器上运行 react-native 应用程序时出现此错误。 Couldn't start project on Android: Error running adb: adb
Javascript 关闭？
方法一 function transform(ar) { var alStr = []; for(var i=0; i
抽屉上的Android抽屉导航自定义图标打开/关闭
我想按以下方式自定义我的抽屉导航: 我希望在抽屉打开时显示一个图标，在抽屉关闭时显示另一个图标，而不是将菜单图标稍微向左滑动的当前默认动画。关于我在哪里可以找到类似内容的任何想法/线索？我做了一些
rest - 关闭 requestLog
我们刚刚从 0.6.2 或 0.7 升级了我们的 dropwizard 版本，发现 .yml 文件中的很多配置都发生了变化。尽管我们能够弄清楚其中的大部分，但我们无法弄清楚如何关闭“requestLo
django - celery 关闭
从 celery 2.4.5 升级后，我开始让 celery 随机关闭。我在 centOS 机器上使用 celery 3.0.12、boto 2.6 和 amazon sqs 和 django 1.
c - 为什么文件无法打开/关闭
我试图包含一些语句来指导用户更多地了解文件无法打开或关闭的原因。文件在写入模式下无法打开的一些可能情况是什么？无法关闭怎么办？ FILE *fp; if(!(fp = fopen("testing",
.net - 关闭.Net应用程序的应用程序设置上的DefaultSettingValueAttribute创建
我有一个DLL，可以访问数据库并从存储在配置文件中的应用程序设置中读取连接字符串。然后，引用此DLL的应用程序将需要在其配置文件中为此配置设置设置值。我遇到的问题是，生成的配置代码会通过Defaul
iphone - 关闭 UIDatePicker
我将 UIDatePicker 添加为 UITextField 的输入 View UIDatePicker *oBirth; NSDateFormatter *dateFormat; _edit
iphone - 关闭 UIImagePickerController
我有以下代码: SecondViewController *secondView = [[SecondViewController alloc] initWithNibName:@"SecondVie
c++ - 队列中的双端队列崩溃(关闭)
Closed. This question does not meet Stack Overflow guidelines。它当前不接受答案。想改善这个问题吗？更新问题，以便将其作为on-topic
macos - 拦截选项-关闭
通常，按下 option 键关闭窗口会关闭应用程序中的所有窗口。在我的应用程序中，我希望它仅关闭与用户正在关闭的窗口相关的窗口。我怎样才能做到这一点？我可以为所有窗口实现 windowShouldCl
cocoa - 关闭 NSWindow
我有一个 NSWindow，它托管一个已连接到脚本处理程序的 WebView。现在，当用户单击 WebView 上的控件上的按钮时，它会调用我的对象上的 Objective C 方法。在这种特定情
MacOS - 检测相机何时打开/关闭
我想根据 MBP 上的相机使用情况自动化个人工作流程。基本上我想知道是否任何的摄像头(内置或 USB)已打开或关闭，因此我可以运行我将创建的程序或脚本。我认为如果我需要轮询相机状态也可以，但基于

首页

博学

6Ren·AI

商城

java - 在 Lucene 中关闭词干提取