java - 集成对 jar 文件的调用 |切| awk 和一个 java 程序成为一个统一的进程-6ren

java - 集成对 jar 文件的调用 |切| awk 和一个 java 程序成为一个统一的进程

转载作者：行者123 更新时间：2023-12-01 11:59:04

26

4

我目前正在执行一个相当复杂的数据预处理操作，这是:

cat large_file.txt \ | ./reverb -q | cut --fields=16,17,18 | awk -F\\t -vq="'" 'function quote(token) { gsub(q, "\\"q, token); return q token q } { print quote($2) "(" quote($3) ", " quote($1) ")." }' >> output.txt

正如你所看到的，这相当复杂，先是猫，然后是那个。/reverb ，然后是 cut，最后是 awk。

接下来我想将输出传递给java程序，即:

public static void main(String[] args) throws IOException 
{
    Ontology ontology = new Ontology();
    BufferedReader br = new BufferedReader(new FileReader("/home/matthias/Workbench/SUTD/2_January/Prolog/horn_data_test.pl"));
    Pattern p = Pattern.compile("'(.*?)'\\('(.*?)','(.*?)'\\)\\."); 
    String line;
    while ((line = br.readLine()) != null) 
    {
        Matcher m = p.matcher(line);
        if( m.matches() ) 
        {
            String verb    = m.group(1);
            String object  = m.group(2);
            String subject = m.group(3);
            ontology.addSentence( new Sentence( verb, object, subject ) );
        }
    }

    for( String joint: ontology.getJoints() )
    {
        for( Integer subind: ontology.getSubjectIndices( joint ) )
        {
            Sentence xaS = ontology.getSentence( subind );
            for( Integer obind: ontology.getObjectIndices( joint ) )
            {
                Sentence yOb = ontology.getSentence( obind );
                Sentence s = new Sentence( xaS.getVerb(),
                                           xaS.getObject(),
                                           yOb.getSubject() );
                System.out.println( s );
            }
        }
    }
}

将这一过程综合为一个连贯操作的最佳方法是什么？理想情况下，我只想指定输入文件和输出文件并运行一次。就目前的情况来看，整个过程相当困惑。

也许我可以将所有这些调用放入 bash 脚本中？这可行吗？

输入最初包含英语句子，每行一个，这是:

Oranges are delicious and contain vitamin c.
Brilliant scientists learned that we can prevent scurvy by imbibing vitamin c.
Colorless green ideas sleep furiously.
...

预处理使其看起来像这样:

'contain'('vitamin c','oranges').
'prevent'('scurvy','vitamin c').
'sleep'('furiously','ideas').
...

java程序是通过推理来学习“规则”的，所以如果处理后的数据产生'contain'('vitamin c','oranges'). & 'prevent'( 'scurvy','vitamin c'). 然后 java 代码将发出 'prevent'('scurvy','oranges').

最佳答案

我查看了混响的源代码，我认为很容易对其进行调整以产生您想要的输出。如果你看一下混响类CommandLineReverb.java，它有以下两个方法:

private void extractFromSentReader(ChunkedSentenceReader reader)
        throws ExtractorException {
    long start;

    ChunkedSentenceIterator sentenceIt = reader.iterator();

    while (sentenceIt.hasNext()) {
        // get the next chunked sentence
        ChunkedSentence sent = sentenceIt.next();
        chunkTime += sentenceIt.getLastComputeTime();

        numSents++;

        // make the extractions
        start = System.nanoTime();
        Iterable<ChunkedBinaryExtraction> extractions = extractor
                .extract(sent);
        extractTime += System.nanoTime() - start;

        for (ChunkedBinaryExtraction extr : extractions) {
            numExtrs++;

            // run the confidence function
            start = System.nanoTime();
            double conf = getConf(extr);
            confTime += System.nanoTime() - start;

            NormalizedBinaryExtraction extrNorm = normalizer
                    .normalize(extr);
            printExtr(extrNorm, conf);
        }
        if (numSents % messageEvery == 0)
            summary();
    }
}

private void printExtr(NormalizedBinaryExtraction extr, double conf) {
    String arg1 = extr.getArgument1().toString();
    String rel = extr.getRelation().toString();
    String arg2 = extr.getArgument2().toString();

    ChunkedSentence sent = extr.getSentence();
    String toks = sent.getTokensAsString();
    String pos = sent.getPosTagsAsString();
    String chunks = sent.getChunkTagsAsString();
    String arg1Norm = extr.getArgument1Norm().toString();
    String relNorm = extr.getRelationNorm().toString();
    String arg2Norm = extr.getArgument2Norm().toString();

    Range arg1Range = extr.getArgument1().getRange();
    Range relRange = extr.getRelation().getRange();
    Range arg2Range = extr.getArgument2().getRange();
    String a1s = String.valueOf(arg1Range.getStart());
    String a1e = String.valueOf(arg1Range.getEnd());
    String rs = String.valueOf(relRange.getStart());
    String re = String.valueOf(relRange.getEnd());
    String a2s = String.valueOf(arg2Range.getStart());
    String a2e = String.valueOf(arg2Range.getEnd());

    String row = Joiner.on("\t").join(
            new String[] { currentFile, String.valueOf(numSents), arg1,
                    rel, arg2, a1s, a1e, rs, re, a2s, a2e,
                    String.valueOf(conf), toks, pos, chunks, arg1Norm,
                    relNorm, arg2Norm });

    System.out.println(row);
}

第一个方法按句子调用并进行提取。然后它调用第二个方法将制表符分隔的值打印到输出流。我想您所要做的就是实现您自己的第二个方法“printExtr()”版本。

关于java - 集成对 jar 文件的调用 |切| awk 和一个 java 程序成为一个统一的进程，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/28123935/

26

4

0

文章推荐： c++ - 使用 srand() 在随机游走中出现蝴蝶图案，为什么？

文章推荐： java - 使用 Java 中的 WEKA 打印预测结果

文章推荐： java - BitmapFactory 解码流在 ListView 中不起作用

文章推荐： java - 如何使用来自哈希集的参数调用方法？

java - Java 方法如何检索属于该特定方法的方法对象？ ( java )
我正在编写一个具有以下签名的 Java 方法。 void Logger(Method method, Object[] args); 如果一个方法(例如 ABC() )调用此方法 Logger，它应该
java - (Java) Java 找不到我的图像文件
我是 Java 新手。我的问题是我的 Java 程序找不到我试图用作的图像文件一个 JButton。 (目前这段代码什么也没做，因为我只是得到了想要的外观第一的)。这是我的主课代码: packag
java - java Java 有手动垃圾回收吗？
好的，今天我在接受采访，我已经编写 Java 代码多年了。采访中说“Java 垃圾收集是一个棘手的问题，我有几个 friend 一直在努力弄清楚。你在这方面做得怎么样？”。她是想骗我吗？还是我的一生都
java - Java 之谜 - Java
我的 friend 给了我一个谜语让我解开。它是这样的: There are 100 people. Each one of them, in his turn, does the following
java - Java 字节码是否兼容不同版本的 Java？
如果我将使用 Java 5 代码的应用程序编译成字节码，生成的 .class 文件是否能够在 Java 1.4 下运行？如果后者可以工作并且我正在尝试在我的 Java 1.4 应用程序中使用 Jav
java - Java 缺少无符号原始类型是 Java 平台的特征还是 Java 语言的特征？
有关于why Java doesn't support unsigned types的问题以及一些关于处理无符号类型的问题。我做了一些搜索，似乎 Scala 也不支持无符号数据类型。限制是Java和S
java - Java 7 的 Java 字节码可以在其他版本的 Java 中工作吗
我只是想知道在一个 java 版本中生成的字节码是否可以在其他 java 版本上运行最佳答案通常，字节码无需修改即可在较新版本的 Java 上运行。它不会在旧版本上运行，除非您使用特殊参数 (
java -cp 。 test.java 与 java test.java
我有一个关于在命令提示符下执行 java 程序的基本问题。在某些机器上我们需要指定 -cp 。 (类路径)同时执行java程序 (test为java文件名与.class文件存在于同一目录下) jav
java - 使用 Java (Java EE/Java SE) 的数据库应用程序设计模式
我已经阅读 StackOverflow 有一段时间了，现在我才鼓起勇气提出问题。我今年 20 岁，目前在我的家乡(罗马尼亚克卢日-纳波卡)就读 IT 大学。足以介绍:D。基本上，我有一家提供簿记应用
java - Java 中的解析可在 Java 中访问
我有 public JSONObject parseXML(String xml) { JSONObject jsonObject = XML.toJSONObject(xml); r
java - Java 中的解释性语言以及对 Java 方法的调用
我已经在 Java 中实现了带有动态类型的简单解释语言。不幸的是我遇到了以下问题。测试时如下代码: def main() { def ks = Map[[1, 2]].keySet()
java - java 序数 - Java I 类
一直提示输入 1 到 10 的数字 - 结果应将 st、rd、th 和 nd 添加到数字中。编写一个程序，提示用户输入 1 到 10 之间的任意整数，然后以序数形式显示该整数并附加后缀。 public
java - 如何从 Java 执行 Java？
我有这个 DownloadFile.java 并按预期下载该文件: import java.io.*; import java.net.URL; public class DownloadFile {
java - 延迟不适用于 java gui(java)
我想在 GUI 上添加延迟。我放置了 2 个 for 循环，然后重新绘制了一个标签，但这 2 个 for 循环一个接一个地执行，并且标签被重新绘制到最后一个。我能做什么？ for(int i=0;
java - Java 类中的硬编码 Java 列表
我正在对对象 Student 的列表项进行一些测试，但是我更喜欢在 java 类对象中创建硬编码列表，然后从那里提取数据，而不是连接到数据库并在结果集中选择记录。然而，自从我这样做以来已经很长时间了，
java - java 幕后对象创建(java 对象实例化)
我知道对象创建分为三个部分: 声明实例化初始化 classA{} classB extends classA{} classA obj = new classB(1,1); 实例化它必须使用
java - 车辆跟踪系统[java/Java EE]
我有兴趣使用 GPRS 构建车辆跟踪系统。但是，我有一些问题要问以前做过此操作的人: GPRS 是最好的技术吗？人们意识到任何问题吗？我计划使用 Java/Java EE - 有更好的技术吗？如果
java - 逆数组(Java)//逆数组(Java)
我可以通过递归方法反转数组，例如:数组={1,2,3,4,5} 数组结果={5,4,3,2,1}但我的结果是相同的数组，我不知道为什么，请帮助我。 public class Recursion { p
java - Java/Java EE 的构建和集成环境
有这样的标准方式吗？包括 Java源代码-测试代码- Ant 或 Maven联合单元持续集成(可能是巡航控制)ClearCase 版本控制工具部署到应用服务器最后我希望有一个自动构建和集成环境。
java - 我将如何从 java 程序打印文本？ ( java )
我什至不知道这是否可能，我非常怀疑它是否可能，但如果可以，您能告诉我怎么做吗？我只是想知道如何从打印机打印一些文本。有什么想法吗？最佳答案这里有更简单的事情。 import javax.swin

首页

博学

6Ren·AI

商城

java - 集成对 jar 文件的调用 |切| awk 和一个 java 程序成为一个统一的进程