- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我正在尝试使用MeCab(http://mecab.sourceforge.net/#download)对日语句子进行分词,并按词性标记每个单词。我按照这些说明安装了 MeCab http://mecab.sourceforge.net/#install-unix 。由于我不想编写 shell 脚本来处理 150,000 个句子(因为我的 Mac OS X 终端在显示日语字符时出现问题),所以我使用现有的 Java 绑定(bind): http://sourceforge.net/projects/mecab/files/mecab-java/0.98pre3/ 。此时,我正在尝试编译并运行给定的 test.java 文件:
import org.chasen.mecab.MeCab;
import org.chasen.mecab.Tagger;
import org.chasen.mecab.Node;
public class test {
static {
try {
System.loadLibrary("MeCab");
} catch (UnsatisfiedLinkError e) {
System.err.println("Cannot load the example native code.\nMake sure your LD_LIBRARY_PATH contains \'.\'\n" + e);
System.exit(1);
}
}
public static void main(String[] argv) {
System.out.println(MeCab.VERSION);
Tagger tagger = new Tagger();
String str = "太郎は二郎にこの本を渡した。";
System.out.println(tagger.parse(str));
Node node = tagger.parseToNode(str);
for (;node != null; node = node.getNext()) {
System.out.println(node.getSurface() + "\t" + node.getFeature());
}
System.out.println ("EOS\n");
}
}
这是自述文件:
1. Build UTF-8 dictionary
2. How to use?
See test.java as sample program.
% java -classpath MeCab.jar test -d ../dic
我编译:javac test.java。然后我运行: java -classpath MeCab.jar test -d ../dic。结果出现以下错误:
Exception in thread "main" java.lang.NoClassDefFoundError: //
Caused by: java.lang.ClassNotFoundException: ..
at java.net.URLClassLoader$1.run(URLClassLoader.java:202)
at java.security.AccessController.doPrivileged(Native Method)
at java.net.URLClassLoader.findClass(URLClassLoader.java:190)
at java.lang.ClassLoader.loadClass(ClassLoader.java:307)
at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:301)
at java.lang.ClassLoader.loadClass(ClassLoader.java:248)
我不太理解这个 mecab-java-0.98pre3 目录的层次结构,所以不知道如何实际编译和运行这个 test.java。伙计们,有什么想法吗?谢谢!
最佳答案
你第一次运行过make吗?第一步是实际构建 mecab-java 绑定(bind)库。
$ tar -xvzf mecab-java-0.xx.tar.gz
$ cd mecab-java-0.xx
$ make
这将导致输出以下 2 个文件:
但是,这假设您的平台是 Linux,您可以访问 make 程序,并且您的 Java 包含文件位于/usr/local/jdk/include。
如果不是这种情况,请尝试阅读 Makefile 以查看是否可以在您自己的环境中构建它。
关于java - 如何编译调用MeCab - 日语词性和词法分析器的java文件?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/5878186/
我正在使用 SpaCy 进行文本分析,但我无法理解词性 (POS) 和句法依赖分析之间的区别。两者都根据单词的作用在句子中标记单词。但它们究竟有何不同? 最佳答案 我们使用词性标注来标记句子中的标记,
我正在使用 SpaCy 进行文本分析,但我无法理解词性 (POS) 和句法依赖分析之间的区别。两者都根据单词的作用在句子中标记单词。但它们究竟有何不同? 最佳答案 我们使用词性标注来标记句子中的标记,
我正在使用 openNLP 来标记 POS(词性)。 InputStream inputStream = new FileInputStream("C:/en-pos-max
抱歉,我是 Pandas 和 NLTK 的新手。我正在尝试构建一组自定义返回的 POS。我的数据内容: comment 0 [(have, VERB), (you, PRO
我正在尝试执行词性标记,并且我对任何基于 Java 的标记器持开放态度(当前使用 OpenNLP)。有没有办法“强制”标记器将特定术语(或单词组合)识别为特定标签,并据此对其他术语进行分类?有点允许标
我想将 nltk.pos_tag 返回的词性 (POS) 用于 sklearn 分类器,如何将它们转换为向量并使用它?例如 sent = "这是 POS 示例" tok=nltk.tokenize.w
我是一名优秀的程序员,十分优秀!