- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我有一个从 HDFS 文件生成的字符串 SparkRDD(名为 RDD1)。我还有一个字符串列表作为字典。我想在 RDD1 上应用映射函数,以便对于字符串的每一行,我在从字典构建的 Lucene 索引之上进行搜索,并返回每行的前三个匹配项。我正在使用 Lucene 的 TopScoreDocCollector 来实现此目的。我对单机版本没有任何问题,但是一旦我在集群上运行它,它就会报告:
ThrowableSerializationWrapper:任务异常无法反序列化 java.lang.ClassNotFoundException:org.apache.lucene.queryparser.classic.ParseException
我的程序逻辑是首先从字典(字符串列表)创建一个广播变量。然后在 map 功能中。我从该广播变量构建 Lucene 索引。我相信当我打电话时会发生错误:
StandardAnalyzer analyzer = new StandardAnalyzer();
我相信这不是由于忘记添加 Lucene jar 造成的。我正在使用以下程序来运行它。
spark-submit --class jinxuanw.clairvoyant.App --jars lucene-analyzers-common-5.3.1.jar,lucene-core-5.3.1.jar,lucene-queryparser-5.3.1.jar jobtitlematch-1.0.jar
最佳答案
不幸的是,StandardAnalyzer
不可序列化,因此无法将此类对象从驱动程序移动到执行程序。尽管如此,可以在执行器中实例化此类对象,从而绕过序列化问题。
关于java - 序列化 Lucene StandardAnalyzer 以进行 Apache Spark RDD 映射转换,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/34208401/
Lucene 5.x 和 2.x 之间 StandardAnalyzer 的默认行为有所不同,例如 that's H&M,使用如下代码: StandardAnalyzer analyzer = new
我已经下载了最新的Lucene 4.6.0和running it in netbeans . Lucence 3.6.x版本运行完美,但最新版本找不到org.apache.lucene.analysi
我正在研究 Lucene 3.x(源代码)。首先我下载了 来自 SVN 的最新源代码 稳定代码 3.0.2 来自:http://www.apache.org/dyn/closer.cgi/luce
当下面的代码执行时,我假设每次解析查询时都会从文件系统中读取停用词文件。除了这样做,我可以重用分析器的同一个实例而不是创建一个新实例吗?它是线程安全的吗? (经过大量谷歌搜索后,我找不到任何相关信息)
我正在使用 Lucene 4.3 为英文推文编制索引,但是我不确定要使用哪个分析器。 Lucene StandardAnalyzer 和 EnglishAnalyzer 有什么区别? 我还尝试使用以下
我正在尝试生成类似于 lucene 中的 QueryParser 所做的事情,但没有解析器,即通过 StandardAnalyzer 运行一个字符串,将其标记化并在 BooleanQuery 中使用
我将 Lucene 的 StandardAnalyzer 用于特定的索引属性。由于像 àéèäöü 这样的特殊字符没有按预期编入索引,我想替换这些字符: à -> a é -> e è -> e ä
我正在尝试使用 Lucene.NET,我正在关注此链接上提供的文档 https://lucenenet.apache.org/ 我使用 Lucene 版本 (4.8.0-beta00012) 和 .N
我正在使用 lucene 4.3.0 并且想用英语和日语字符标记文档。 An example is like "LEICA S2 カタログ (新品)" The StandardAnal
首先,对于 Tika 和 Lucene,我完全是个菜鸟。我正在阅读《Tika in Action》一书,尝试其中的示例。第 5 章给出了这个例子: package tikatest01; import
当使用 Lucene 实现标记化时,出现了与 org.apache.lucene.analysis.StandardAnalyzer 相关的问题,因为抛出了以下异常: The import org.a
我是 Apache Lucene 的新手。我目前使用的是最新版本:6.2.1 基于他们的官方文档:http://lucene.apache.org/core/6_2_1/core/org/apache
我使用 Lucene 在 Android 中创建了一本医学词典。单词和定义是丹麦语,我正在使用 StandardAnalyzer 来索引和搜索条目。这个想法是,当我点击我的 ListView 中的一个
https://github.com/larsga/Duke - 我正在使用 Duke - 进行重复数据删除。 我已经设置了 Duke(jar 文件 - Duke jar 以及 lucene jar
我有一个从 HDFS 文件生成的字符串 SparkRDD(名为 RDD1)。我还有一个字符串列表作为字典。我想在 RDD1 上应用映射函数,以便对于字符串的每一行,我在从字典构建的 Lucene 索引
我尝试使用 TermQuery 测试 Lucene 上的搜索。但是,似乎只有在使用 WhitespaceAnalyzer 时搜索才有效。当我切换到 StandardAnalyzer 时,测试失败了。
我正在阅读有关使用 Lucene 的 Hibernate 搜索引擎的信息,并且我能够在通过 mysql 数据库保存文章的 Article 类上按如下方式进行设置。我的目标是向用户显示他们在浏览器上搜索
我正在尝试使用 PyLucene,但找不到任何在当前版本中实际运行的代码示例。 (例如,参见http://nullege.com/codes/search/PyLucene.StandardAnaly
我是 lucene 的新手。我正在尝试在这里做教程 http://www.lucenetutorial.com/lucene-in-5-minutes.html 网站正在导入: import org.
当我尝试构建第一个 hibernate 应用程序时,发生以下错误NoClassDefFoundError Exception in thread "main" java.lang.NoClassDef
我是一名优秀的程序员,十分优秀!