- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
有谁知道如何解决 TreeTagger
中的这个文件读取错误?这是一种常用的自然语言处理工具 POS
标记、词形还原和块化句子?
alvas@ikoma:~/treetagger$ echo 'Hello world!' | cmd/tree-tagger-english
reading parameters ...
ERROR: Can't open for reading: /home/alvas/treetagger/lib/english.par
aborted.
alvas@ikoma:~$ mkdir treetagger
alvas@ikoma:~$ cd treetagger
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tree-tagger-linux-3.2.tar.gz
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/tagger-scripts.tar.gz
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/install-tagger.sh
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/dutch-par-linux-3.2-utf8.bin.gz
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/german-par-linux-3.2-utf8.bin.gz
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/italian-par-linux-3.2-utf8.bin.gz
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/spanish-par-linux-3.2-utf8.bin.gz
alvas@ikoma:~/treetagger$ wget ftp://ftp.ims.uni-stuttgart.de/pub/corpora/french-par-linux-3.2-utf8.bin.gz
alvas@ikoma:~/treetagger$ sh install-tagger.sh
Linux version of TreeTagger installed.
Tagging scripts installed.
German parameter file (Linux, UTF8) installed.
German chunker parameter file (Linux) installed.
French parameter file (Linux, UTF8) installed.
French chunker parameter file (Linux, UTF8) installed.
Italian parameter file (Linux, UTF8) installed.
Spanish parameter file (Linux, UTF8) installed.
Dutch parameter file (Linux, UTF8) installed.
Path variables modified in tagging scripts.
You might want to add /home/alvas/treetagger/cmd and /home/alvas/treetagger/bin to the PATH variable so that you do not need to specify the full path to run the tagging scripts.
alvas@ikoma:~/treetagger$ echo 'Hello world!' | cmd/tree-tagger-english
reading parameters ...
ERROR: Can't open for reading: /home/alvas/treetagger/lib/english.par
aborted.
alvas@ikoma:~/treetagger$ echo 'Das ist ein Test.' | cmd/tagger-chunker-german
ERROR: Can't open for reading: /home/alvas/treetagger/lib/german-chunker.par
aborted.
ERROR: Can't open for reading: /home/alvas/treetagger/lib/german.par
aborted.
reading parameters ...
ERROR: Can't open for reading: /home/alvas/treetagger/lib/german.par
aborted.
最佳答案
我认为有两个问题:首先,脚本的名称中应该有“-utf8”,例如cmd/tagger-chunker-german-utf8
,因为您下载了 UTF-8 数据。其次,标记和分块都需要一个数据文件。查看主页,其中有“PC 的参数文件”和“PC 的 Chunker 参数文件”部分 - 从这两个部分下载文件,然后重新执行 install-tagger.sh
.
关于installation - TreeTagger 安装成功但无法打开 .par 文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/15503388/
有谁知道如何解决 TreeTagger 中的这个文件读取错误?这是一种常用的自然语言处理工具 POS标记、词形还原和块化句子? alvas@ikoma:~/treetagger$ echo 'Hell
我有一个使用 TreeTagger 的 Java 应用程序(Ninja 框架)。 TreeTagger 的根目录是通过环境变量 TREETAGGER_HOME 设置的。当我通过 ninja 运行应用程
我对 NLP 等非常非常陌生。因此,我有一个非常基本的问题。我想使用 Mac OSX 10.6.8 使用 TreeTagger 对文件语料库进行 POS 标记。我已经按照 http://www.cis
来自TreeTagger's website我创建了一个目录并下载了指定的文件。然后treetaggerwrapper ,因此从 documentation我尝试测试并尝试如何标记一些文本,如下所示:
我尝试使用以下命令安装 python 模块 (treetager-python): python3 setup.py install 尝试此操作时,出现错误: running install runn
我是一名优秀的程序员,十分优秀!