- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我无法在elasticsearch中使用mecab tokenizer安装elasticsearch 5.2和mecab-ko、mecab-ko-dict、analysis-mecab-ko(elasticsearch mecab插件)后,我可以像这样创建索引mecab tokenizer:
#!/usr/bin/env bash
ES='http://localhost:9200'
ESIDX='seunjeon-idx'
echo "put setting"
curl -XPUT "${ES}/${ESIDX}/?pretty" -d '{
"settings" : {
"index":{
"analysis":{
"analyzer":{
"korean":{
"type":"custom",
"tokenizer":"seunjeon_default_tokenizer"
}
},
"tokenizer": {
"seunjeon_default_tokenizer": {
"type": "mecab_ko_standard_tokenizer",
"mecab_args": "/usr/local/lib/mecab/dic/mecab-ko-dic"
}
}
}
}
}
}'
但是下面的curl命令不起作用。
curl -XGET "http://192.168.0.10:9200/seunjeon-idx/_analyze?
analyzer=korean&pretty" -d '삼성전자'
执行上述命令后,/var/log/elasticsearch/elasticsearch.log 中显示以下日志:
java.lang.UnsatisfiedLinkError: no MeCab in java.library.path
at org.bitbucket.eunjeon.mecab_ko_mecab_loader.MeCabLoader.lambda$static$0(MeCabLoader.java:36) ~[?:?]
at java.security.AccessController.doPrivileged(Native Method) ~[?:1.8.0_161]
at org.bitbucket.eunjeon.mecab_ko_mecab_loader.MeCabLoader.<clinit>(MeCabLoader.java:28) ~[?:?]
at org.bitbucket.eunjeon.elasticsearch.index.analysis.MeCabKoTokenizerFactoryBase.create(MeCabKoTokenizerFactoryBase.java:74) ~[?:?]
at org.elasticsearch.index.analysis.CustomAnalyzer.createComponents(CustomAnalyzer.java:83) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.apache.lucene.analysis.AnalyzerWrapper.createComponents(AnalyzerWrapper.java:134) ~[lucene-core-6.4.0.jar:6.4.0 bbe4b08cc1fb673d0c3eb4b8455f23ddc1364124 - jim - 2017-01-17 15:57:29]
at org.apache.lucene.analysis.Analyzer.tokenStream(Analyzer.java:198) ~[lucene-core-6.4.0.jar:6.4.0 bbe4b08cc1fb673d0c3eb4b8455f23ddc1364124 - jim - 2017-01-17 15:57:29]
at org.elasticsearch.action.admin.indices.analyze.TransportAnalyzeAction.simpleAnalyze(TransportAnalyzeAction.java:215) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.action.admin.indices.analyze.TransportAnalyzeAction.analyze(TransportAnalyzeAction.java:200) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.action.admin.indices.analyze.TransportAnalyzeAction.shardOperation(TransportAnalyzeAction.java:148) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.action.admin.indices.analyze.TransportAnalyzeAction.shardOperation(TransportAnalyzeAction.java:75) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.action.support.single.shard.TransportSingleShardAction$ShardTransportHandler.messageReceived(TransportSingleShardAction.java:294) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.action.support.single.shard.TransportSingleShardAction$ShardTransportHandler.messageReceived(TransportSingleShardAction.java:287) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.transport.TransportRequestHandler.messageReceived(TransportRequestHandler.java:33) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.transport.RequestHandlerRegistry.processMessageReceived(RequestHandlerRegistry.java:69) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.transport.TransportService$7.doRun(TransportService.java:610) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.common.util.concurrent.ThreadContext$ContextPreservingAbstractRunnable.doRun(ThreadContext.java:596) ~[elasticsearch-5.2.0.jar:5.2.0]
at org.elasticsearch.common.util.concurrent.AbstractRunnable.run(AbstractRunnable.java:37) ~[elasticsearch-5.2.0.jar:5.2.0]
at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149) ~[?:1.8.0_161]
at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624) ~[?:1.8.0_161]
at java.lang.Thread.run(Thread.java:748) [?:1.8.0_161]
尝试并检查:
ldconfig -p | grep libmecab
libmecab.so.2 (libc6,x86-64) => /usr/local/lib/libmecab.so.2
libmecab.so (libc6,x86-64) => /usr/local/lib/libmecab.so
(https://groups.google.com/forum/#!topic/eunjeon/Yvr80vjvO74)
最佳答案
您可以尝试设置 -Djava.library.path=/usr/local/lib:/path/to/mecab.so/dir在弹性启动脚本中。
关于java - elasticsearch java.library.pat 错误中没有 MeCab,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/48634514/
是否有某处描述 Mecab 算法的文档? 或者谁能给出一个简单的一段或一页的描述? 我发现很难理解现有代码以及数据库包含的内容。 我的免费网站和手机教学语言应用程序 (www.jtlanguage.c
有人可以告诉我 MeCab 默认输出吗? MeCab 输出什么注释以及在哪里可以找到 morpho 分析器的标记集 http://mecab.sourceforge.net/ 任何人都可以破译 MeC
meecab 的示例输出: に ニ ニ に 助詞-格助詞 我们将助词(粒子)作为类型,将格助词(格助词)作为PoS。在哪里可以找到 mecab 使用的所有可能类型和 PoS
我想向 MeCab 添加停用词,例如“我”、“你”等。但我在MeCab的手册上找不到任何停用词的信息。 最佳答案 MeCab 是一个词性标注器,它不删除停用词。 您需要通过处理输出并查看表面形式(文字
背景:我已经构建了一个自定义搜索引擎,它在英语中运行良好,但在日语中失败,尽管我的主机服务器确认我已经正确安装了日语 mecab 解析器。我自己的检查显示以下内容: 1) 显示创建表: FULLTEX
我下载了 MeCab 来解析一些日语文本。为了对其进行测试,我尝试按照一些在线示例进行操作。 例如,我逐字遵循了这个人的提示:http://www.robfahey.co.uk/blog/japane
我已经成功使用了MeCab Java打电话Mecab从我的Java代码。我使用以下语句来初始化标记器: tagger = new Tagger("--node-format=%f[7]\\t --un
我正在尝试使用一个名为 MeCab 的程序,它对日语文本进行语法分析。我遇到的问题是它返回一个字节字符串,如果我尝试打印它,它会为几乎所有字符打印问号。但是,如果我尝试使用 .decode,它会抛出一
我正在使用位于 https://github.com/FLCLjp/iPhone-libmecab 的 MeCab iPhone 库.我在标记所有可能的单词时遇到了一些麻烦。具体来说,我不能将“吉本兴
我编写了一个 GUI,它允许日文输入,当您转到文件时 > 解析写入文本文件。然后该文本文件通过 MeCab 运行,其中在单词之间放置空格。之后应该再次写入文本文件,以便在另一个 GUI 窗口中显示。
使用 Natto gem (MeCab) 是否可以将混合的片假名/平假名/汉字/字母字符串转换为片假名/平假名/字母? (即转换汉字)。 例如我需要转换这个文本: 日本語だぜ、これが。 これはカタカナ
我正尝试在我一直在开发的新应用程序中使用 Mecab,但我无法让该库正常工作。最初,我尝试了以下应该与 iOS 6 兼容的存储库: https://github.com/gumob/mecab 我尝试
我正在尝试将 mecab 库添加到 aws lambda 层,但没有成功。 我想要的是将日语和韩语标记化。 token 化就足够了。 这是我所做的。 (我引用了这个网站:https://towards
今天我一直在尝试安装 this guy,但失败了。 (Python 3.5+ 的 MeCab 库)为了构建一个简单的个性化日语可读性分析工具(作为语言和数据 Nerd 的学习者)。 当然,我首先尝试的
我无法在elasticsearch中使用mecab tokenizer安装elasticsearch 5.2和mecab-ko、mecab-ko-dict、analysis-mecab-ko(elas
我正在尝试使用日语词法分析器 MeCab在 C# 程序(Visual Studio 2010 Express、Windows 7)中,编码出了点问题。如果我的输入(粘贴到文本框中)是这样的: 一方、広
我正在尝试通过 pip install mecab-python3 安装 mecab-python3,但出现以下错误。 Collecting mecab-python3 Using cached ht
我安装了“https://code.google.com/p/mecab/downloads/list”。 还有 >>> import MeCab Traceback (most recent cal
我正在尝试构建 MeCab 0.996带有 UniDic CWJ 2.3.0 的用户字典在 Ubuntu 20.10 上使用以下终端命令: $ /usr/local/libexec/mecab/mec
我是一名优秀的程序员,十分优秀!