gpt4 book ai didi

java - RDF4J:解析来自端点的查询结果并将其存储为 ntriples 文件(格式错误的查询)

转载 作者:行者123 更新时间:2023-11-29 08:24:32 25 4
gpt4 key购买 nike

this endpoint 有一个选项可以获取 N-triples 格式的查询结果。我想在连接到端点时对 rdf4j 库执行相同的操作,并将结果保存在 ntriples 格式的文件中。

到目前为止,我使用了 graphQuery (CONSTRUCT):

        .....
String queryString = prefixes +
" CONSTRUCT { ?sub ?hasProp ?prop } WHERE { ?sub ?hasProp ?prop FILTER(?sub = yago:Naples) } ";
GraphQuery graphQuery = con.prepareGraphQuery(QueryLanguage.SPARQL, queryString);
RDFWriter writer = new NTriplesWriter(System.out);
graphQuery.evaluate(writer);

不幸的是,我得到:[来自服务器的格式错误的查询结果](应为“.”,发现为“–”)。在端点中,结果返回得很好(Ntriples 格式)。这可能是 rdf4j 的错误吗?

> <http://yago-knowledge.org/resource/Naples>
> <http://yago-knowledge.org/resource/linksTo>
> <http://yago-knowledge.org/resource/S.S.C._Napoli> .
> <http://yago-knowledge.org/resource/Naples>
> <http://yago-knowledge.org/resource/linksTo>
> <http://yago-knowledge.org/resource/Treno_Alta_Velocit\u00E0> .
> <http://yago-know18:50:57.014 [main] ERROR
> o.e.r.rio.helpers.ParseErrorLogger - [Rio fatal] Expected '.', found
> '–' (386, -1) org.eclipse.rdf4j.query.QueryEvaluationException:
> Malformed query result from server at
> org.eclipse.rdf4j.repository.sparql.query.SPARQLGraphQuery.evaluate(SPARQLGraphQuery.java:69)
> at org.example.Connect.main(Connect.java:60) Caused by:
> org.eclipse.rdf4j.repository.RepositoryException: Malformed query
> result from server at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.getRDF(SPARQLProtocolSession.java:934)
> at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.sendGraphQuery(SPARQLProtocolSession.java:463)
> at
> org.eclipse.rdf4j.repository.sparql.query.SPARQLGraphQuery.evaluate(SPARQLGraphQuery.java:62)
> ... 1 more Caused by: org.eclipse.rdf4j.rio.RDFParseException:
> Expected '.', found '–' [line 386] at
> org.eclipse.rdf4j.rio.helpers.RDFParserHelper.reportFatalError(RDFParserHelper.java:403)
> at
> org.eclipse.rdf4j.rio.helpers.AbstractRDFParser.reportFatalError(AbstractRDFParser.java:755)
> at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.reportFatalError(TurtleParser.java:1318)
> at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.verifyCharacterOrFail(TurtleParser.java:1153)
> at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parseStatement(TurtleParser.java:241)
> at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parse(TurtleParser.java:201)
> at
> org.eclipse.rdf4j.rio.turtle.TurtleParser.parse(TurtleParser.java:143)
> at
> org.eclipse.rdf4j.http.client.SPARQLProtocolSession.getRDF(SPARQLProtocolSession.java:931)
> ... 3 more

最佳答案

当 RDF4J 的 SPARQLRepository 针对此端点执行 SPARQL 查询请求时,端点以 Turtle 格式发回其响应。不幸的是,该响应包含语法错误。发生的情况如下:

  1. RDF4J做一个查询请求,指明几种可接受的结果格式(包括Turtle和N-Triples);
  2. 端点执行查询,选择Turtle作为响应格式,并将查询结果序列化到Turtle中;
  3. RDF4J接收Turtle数据并解析;
  4. 解析后的结果被传递给 NTriplesWriter,然后将其写出。

但是,端点发回的查询结果文档在语法上不是有效的 Turtle,这导致 RDF4J 的 Turtle 解析器在步骤 3 中因错误而中止。

问题是响应中的这一行(第 386 行):

    yago:Italian_War_of_1494–98 ,

具体来说,149498 之间的字符。虽然它看起来像一个完全合法的减号 (-),但它实际上是一个所谓的“破折号”(Unicode 字符 0x2013)。这不是 Turtle 前缀名称中的合法字符。

端点的 Turtle 编写器应该通过更改为完整 URI 而不是前缀名称并使用 Unicode 转义序列来正确序列化值,如下所示:

<http://yago-knowledge.org/resource/Italian_War_of_1494\u201398>

与端点维护者一起记录错误报告以及针对此效果的建议修复可能是值得的。

作为解决方法,端点的 N-Triples 输出(如果您强制它使用 N-Triples 而不是 Turtle 进行响应)在语法上确实是正确的。您可以通过“覆盖”RDF4J 的 SPARQLRepository 发送的标准 Accept header 来强制服务器使用 N-Triples 而不是 Turtle 进行响应,如下所示:

SPARQLRepository repo = new SPARQLRepository(endpoint);

// create a new map of additional http headers
Map<String, String> headers = new HashMap<String, String>();

// we set the Accept header to _only_ accept text/plain, forcing the endpoint
// to use N-Triples as the response format. This overwrites the standard
// Accept header that RDF4J sends.
headers.put("Accept", "text/plain");
repo.setAdditionalHttpHeaders(headers);

完成后,您的其余代码应该可以正常工作。

关于java - RDF4J:解析来自端点的查询结果并将其存储为 ntriples 文件(格式错误的查询),我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/54269329/

25 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com