- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我想使用 Java 代码中的 Apache Jena 的库将 tsv 文件转换为 rdf 文件。我找到了一个从 csv 转换为 rdf 的示例,但它对我没有多大帮助。链接为:http://www.essi.upc.edu/dtim/blog/post/enter-the-world-of-semantics-using-jena-to-convert-your-data-to-rdf
你能给我一些想法吗?多谢!我应该对给定的代码进行哪些更改?
import java.io.BufferedReader;
import java.io.BufferedWriter;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.FileWriter;
import java.io.IOException;
import java.io.InputStream;
import java.io.PrintWriter;
import java.util.Scanner;
import org.apache.commons.io.FileUtils;
import org.apache.jena.graph.Node;
import org.apache.jena.graph.NodeFactory;
import org.apache.jena.graph.Triple;
import org.apache.jena.propertytable.graph.GraphCSV;
import org.apache.jena.propertytable.lang.CSV2RDF;
import org.apache.jena.query.Query;
import org.apache.jena.query.QueryExecution;
import org.apache.jena.query.QueryExecutionFactory;
import org.apache.jena.query.QueryFactory;
import org.apache.jena.query.QuerySolution;
import org.apache.jena.query.ResultSet;
import org.apache.jena.rdf.model.Model;
import org.apache.jena.rdf.model.ModelFactory;
import org.apache.jena.rdf.model.RDFNode;
import org.apache.jena.rdf.model.ResourceFactory;
import org.apache.jena.rdf.model.Statement;
import org.apache.jena.util.FileManager;
import org.apache.jena.vocabulary.RDF;
public static void convertCSVToRDF (String file,
String inputFilename, String outputFilename,String outputType) {
//Just a few lines below to convert the data from CSV to an RDF graph,
see how easy?!
CSV2RDF.init();//Initialise the CSV conversion engine in Jena
GraphCSV newGraph = new GraphCSV(inputFilename);
Model model = ModelFactory.createModelForGraph(newGraph);
//Manually insert class triples for each instance in the CSV file
String sparqlQueryString = "select distinct ?s where {?s ?p ?o}";
Query query = QueryFactory.create(sparqlQueryString);
QueryExecution qexec = QueryExecutionFactory.create(sparqlQueryString, model);
ResultSet s = qexec.execSelect();
Model m2 = ModelFactory.createDefaultModel();
while(s.hasNext()) {
QuerySolution so = s.nextSolution();
Triple t = new Triple(so.getResource("s").asNode(),RDF.type.asNode(),
NodeFactory.createBlankNode(file));
Statement stmt = ResourceFactory.createStatement(so.getResource("s"), RDF.type,
ResourceFactory.createResource(file));
m2.add(stmt);
}
Model m3 = ModelFactory.createUnion(model, m2); //create a new RDF graph which "unions"
//the old graph with the new graph containing
//the new rows
//Now serialize the RDF graph to an output file using the outputType input variable
you specify. It should be “N-Triple” in our case.
try {
FileWriter out = new FileWriter(outputFilename);
m3.write(out,outputType);
} catch (Exception e) {
System.out.println("Error in the file output process!");
e.printStackTrace();
}
//Delete specific triples of a specific predicate called ¨row¨
File output = new File(outputFilename);
File tempFile = new File("C:/Users/user1/SampleFile/temp.nt");
BufferedReader reader = null;
BufferedWriter writer = null;
try {
reader = new BufferedReader(new FileReader(output));
writer = new BufferedWriter(new FileWriter(tempFile));
String currentLine;
//Delete triples from the old file by skipping it while reading the input N-Triple
file from the last step, otherwise write the triple to a new temp file!
while ((currentLine = reader.readLine()) != null) {
if (currentLine.contains("http://w3c/future-csv-vocab/row")) {
continue;
} else {
writer.write(currentLine);
writer.newLine();
}
}
writer.close();
reader.close();
PrintWriter printer = new PrintWriter(output);
printer.print("");
printer.close();
//copy content from temp file to final output file, overwriting it.
FileUtils.copyFile(tempFile, output);
} catch (FileNotFoundException e1) {
// TODO Auto-generated catch block
e1.printStackTrace();
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
最佳答案
在耶拿没有内置方法将 TSV 转换为 RDF,因为 TSV(就像 CSV)不是 RDF 的格式,而是适用于以表格形式表示的任何数据。也许出于这个原因,Jena 中删除了 CSV 支持(jena-csv 的最新版本是 3.9.0)。
但是 TSV - tab s分离的v值 - 是非常简单的格式。将 TSV 数据转换为 RDF 是一项非常简单的任务(大约 10 分钟编码)。您可以使用 TSV 做任何您想做的事情,例如,您可以将所有 TSV 添加为一个巨大的文字。
但以下方式演示了一种合理的方法,其中每一行都是具有数据属性断言的 OWL 个体。
String tsv = "Sepal length\tSepal width\tPetal length\tPetal width\tSpecies\n" +
"5.1\t3.5\t1.4\t0.2\tI. setosa\n" +
"4.9\t3.0\t1.4\t0.2\tI. setosa";
Charset ch = StandardCharsets.UTF_8;
String separator = "\t";
String ns = "http://ex#";
UnaryOperator<String> nameToURI = s -> ns + s.toLowerCase().replace(" ", "_");
Model m = ModelFactory.createDefaultModel()
.setNsPrefixes(PrefixMapping.Standard)
.setNsPrefix("ex", ns);
Resource clazz = m.createResource(ns + "MyClass", OWL.Class);
try (InputStream is = new ByteArrayInputStream(tsv.getBytes(ch));
Reader r = new InputStreamReader(is, ch);
BufferedReader br = new BufferedReader(r)) {
String first = br.lines().findFirst().orElseThrow(IllegalArgumentException::new);
List<Property> props = Arrays.stream(first.split(separator))
.map(s -> m.createResource(nameToURI.apply(s), OWL.DatatypeProperty)
.addProperty(RDFS.label, s).as(Property.class))
.collect(Collectors.toList());
br.lines().forEach(line -> {
String[] data = line.split(separator);
if (data.length != props.size()) throw new IllegalArgumentException();
Resource individual = m.createResource(clazz);
for (int i = 0; i < data.length; i++) {
individual.addProperty(props.get(i), data[i]);
}
});
}
m.write(System.out, "ttl");
输出:
@prefix ex: <http://ex#> .
@prefix owl: <http://www.w3.org/2002/07/owl#> .
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix rdfs: <http://www.w3.org/2000/01/rdf-schema#> .
@prefix dc: <http://purl.org/dc/elements/1.1/> .
ex:MyClass a owl:Class .
ex:sepal_width a owl:DatatypeProperty ;
rdfs:label "Sepal width" .
ex:species a owl:DatatypeProperty ;
rdfs:label "Species" .
ex:sepal_length a owl:DatatypeProperty ;
rdfs:label "Sepal length" .
ex:petal_length a owl:DatatypeProperty ;
rdfs:label "Petal length" .
ex:petal_width a owl:DatatypeProperty ;
rdfs:label "Petal width" .
[ a ex:MyClass ;
ex:petal_length "1.4" ;
ex:petal_width "0.2" ;
ex:sepal_length "5.1" ;
ex:sepal_width "3.5" ;
ex:species "I. setosa"
] .
[ a ex:MyClass ;
ex:petal_length "1.4" ;
ex:petal_width "0.2" ;
ex:sepal_length "4.9" ;
ex:sepal_width "3.0" ;
ex:species "I. setosa"
] .
关于java - TSV 文件转换为 RDF,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/56816846/
我正在编写一个具有以下签名的 Java 方法。 void Logger(Method method, Object[] args); 如果一个方法(例如 ABC() )调用此方法 Logger,它应该
我是 Java 新手。 我的问题是我的 Java 程序找不到我试图用作的图像文件一个 JButton。 (目前这段代码什么也没做,因为我只是得到了想要的外观第一的)。这是我的主课 代码: packag
好的,今天我在接受采访,我已经编写 Java 代码多年了。采访中说“Java 垃圾收集是一个棘手的问题,我有几个 friend 一直在努力弄清楚。你在这方面做得怎么样?”。她是想骗我吗?还是我的一生都
我的 friend 给了我一个谜语让我解开。它是这样的: There are 100 people. Each one of them, in his turn, does the following
如果我将使用 Java 5 代码的应用程序编译成字节码,生成的 .class 文件是否能够在 Java 1.4 下运行? 如果后者可以工作并且我正在尝试在我的 Java 1.4 应用程序中使用 Jav
有关于why Java doesn't support unsigned types的问题以及一些关于处理无符号类型的问题。我做了一些搜索,似乎 Scala 也不支持无符号数据类型。限制是Java和S
我只是想知道在一个 java 版本中生成的字节码是否可以在其他 java 版本上运行 最佳答案 通常,字节码无需修改即可在 较新 版本的 Java 上运行。它不会在旧版本上运行,除非您使用特殊参数 (
我有一个关于在命令提示符下执行 java 程序的基本问题。 在某些机器上我们需要指定 -cp 。 (类路径)同时执行java程序 (test为java文件名与.class文件存在于同一目录下) jav
我已经阅读 StackOverflow 有一段时间了,现在我才鼓起勇气提出问题。我今年 20 岁,目前在我的家乡(罗马尼亚克卢日-纳波卡)就读 IT 大学。足以介绍:D。 基本上,我有一家提供簿记应用
我有 public JSONObject parseXML(String xml) { JSONObject jsonObject = XML.toJSONObject(xml); r
我已经在 Java 中实现了带有动态类型的简单解释语言。不幸的是我遇到了以下问题。测试时如下代码: def main() { def ks = Map[[1, 2]].keySet()
一直提示输入 1 到 10 的数字 - 结果应将 st、rd、th 和 nd 添加到数字中。编写一个程序,提示用户输入 1 到 10 之间的任意整数,然后以序数形式显示该整数并附加后缀。 public
我有这个 DownloadFile.java 并按预期下载该文件: import java.io.*; import java.net.URL; public class DownloadFile {
我想在 GUI 上添加延迟。我放置了 2 个 for 循环,然后重新绘制了一个标签,但这 2 个 for 循环一个接一个地执行,并且标签被重新绘制到最后一个。 我能做什么? for(int i=0;
我正在对对象 Student 的列表项进行一些测试,但是我更喜欢在 java 类对象中创建硬编码列表,然后从那里提取数据,而不是连接到数据库并在结果集中选择记录。然而,自从我这样做以来已经很长时间了,
我知道对象创建分为三个部分: 声明 实例化 初始化 classA{} classB extends classA{} classA obj = new classB(1,1); 实例化 它必须使用
我有兴趣使用 GPRS 构建车辆跟踪系统。但是,我有一些问题要问以前做过此操作的人: GPRS 是最好的技术吗?人们意识到任何问题吗? 我计划使用 Java/Java EE - 有更好的技术吗? 如果
我可以通过递归方法反转数组,例如:数组={1,2,3,4,5} 数组结果={5,4,3,2,1}但我的结果是相同的数组,我不知道为什么,请帮助我。 public class Recursion { p
有这样的标准方式吗? 包括 Java源代码-测试代码- Ant 或 Maven联合单元持续集成(可能是巡航控制)ClearCase 版本控制工具部署到应用服务器 最后我希望有一个自动构建和集成环境。
我什至不知道这是否可能,我非常怀疑它是否可能,但如果可以,您能告诉我怎么做吗?我只是想知道如何从打印机打印一些文本。 有什么想法吗? 最佳答案 这里有更简单的事情。 import javax.swin
我是一名优秀的程序员,十分优秀!