- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
您好,我一直在努力从事信息检索方面的工作,但遇到了一些困难。最近我从以下链接下载了 StandAloneAnnie.java
http://gate.ac.uk/wiki/code-repository/src/sheffield/examples/StandAloneAnnie.java虽然我已经能够执行它并看到输出,但我有一个或两个查询。
这个程序对人和地点进行标注,用于标注这些实体的语法存储在哪里。
我如何编写自己的简单语法来提取一些数据并在我的 StandAloneAnnie.java 副本中使用它?
以前的帖子 Hundreds of RegEx on one string New to NLP, Question about annotation
最佳答案
下面是一个简单的标注人高度的语法
Phase: Meaurements
Input: Token Number
Options: control=appelt debug=true
Rule: Height
(
({Number})
( {Token.string=~"[Ff]t"} | {Token.string=~"[Ii]n"} | {Token.string=~"[Cc]m"})
):height
-->
:height.Height= {value= :height.Number.value, unit= :height.Token.string}
这是执行的主要代码,
public static void main(String arg[]) {
Gate.init();
gate.Corpus corpus= (Corpus) Factory.createResource("gate.corpora.CorpusImpl");
//You need to register the plugin before you load it.
Gate.getCreoleRegister().registerDirectories(new File(Gate.getPluginsHome(), ANNIEConstants.PLUGIN_DIR).toURI().toURL());
Gate.getCreoleRegister().registerDirectories(new URL("file:///GATE_HOME/plugins/Tagger_Numbers"));//change this path
Document doc = new DocumentImpl();
//The string to be annotated.
String str = "Height is 60 in. Weight is 150 lbs pulse rate 90 Pulse rate 90";
DocumentContentImpl impl = new DocumentContentImpl(str);
doc.setContent(impl);
//Loading processing resources. refer http://gate.ac.uk/gate/doc/plugins.html for what class the plugin belongs to
ProcessingResource token = (ProcessingResource) Factory.createResource("gate.creole.tokeniser.DefaultTokeniser", Factory.newFeatureMap());
ProcessingResource sspliter = (ProcessingResource) Factory.createResource("gate.creole.splitter.SentenceSplitter", Factory.newFeatureMap());
ProcessingResource number = (ProcessingResource) Factory.createResource("gate.creole.numbers.NumbersTagger", Factory.newFeatureMap());
/*pipeline is an application that needs to be created to use resources loaded above.
Reasources must be added in a particular order eg. below the 'number' resource requires the document to be tokenised. */
corpus.add(doc);
SerialAnalyserController pipeline = (SerialAnalyserController) Factory.createResource("gate.creole.SerialAnalyserController", Factory.newFeatureMap(), Factory.newFeatureMap(), "ANNIE");
pipeline.setCorpus(corpus);
pipeline.add(token);
pipeline.add(sspliter);
pipeline.add(number);
pipeline.execute();
//Extract info from an annotated document.
AnnotationSetImpl ann=(AnnotationSetImpl)doc.getAnnotations();
Iterator<Annotation>i = ann.get(vital).iterator();
Annotation annotation = i.next();
long start = annotation.getStartNode().getOffset();
long end = annotation.getEndNode().getOffset();
System.out.println(doc.toString().substring((int)start, (int)end));
}
注意:-在上面的代码中,Height 的语法将被写在一个.jape 文件中。您需要使用 JAPE(JAPE Plus) 转换器运行此语法。我们只需要在我们的主代码中执行应用程序('pipeline')。您可以在 gate.ac.uk/sale/tao 找到编写 jape 的教程
关于java - Gate ANNIE 语法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/7038283/
您好,我一直在努力从事信息检索方面的工作,但遇到了一些困难。最近我从以下链接下载了 StandAloneAnnie.java http://gate.ac.uk/wiki/code-repositor
我一直致力于信息提取,并且能够运行 standAloneAnnie.java http://gate.ac.uk/wiki/code-repository/src/sheffield/examples
我正在尝试使用 ANNIE 提取电子邮件的注释集。电子邮件是 ANNIE 提供的默认注释类型。我正在使用以下代码:- AnnotationSet defaultAnnotSet = doc.getAn
我需要使用 Python 从 App Annie 的 API 中提取一些数据。但是我无法连接。我仔细检查了我的 API key 和“文档”。有谁知道我如何通过他们的 API 进行连接?我不断收到 40
我是 GATE ANNIE 的新手。我尝试了 GATE GUI 界面 并获得了在其上执行任务的经验。我想知道如何在 Java 中实现命名实体提取? 我进行了研发,但找不到任何关于命名实体提取的教程。
当我将我的 Apple 帐户连接到 App Annie 时,我创建了一个新的电子邮件地址(实际上只是来 self 域的一个简单的转发电子邮件)附加到一个只能访问销售数据的 Apple 帐户 - 并将该
是否有一个 API 可以让我们为 iPhone 或 iPad 应用程序的价格变化编制索引? 例如,this company , this company , 和 App Annie收集 iOS 价格数
我正在寻找有关在 .net 环境中使用 Gate 和 ANNIE 的指导。是否有人使用 IKVMC 将 GATE 转换为 .NET DLL,并使用转换后的 DLL 在 .NET/C# 中成功运行命名实
我是一名优秀的程序员,十分优秀!