python - 如何使用 RDFLib 解析 .ttl 文件？-6ren

python - 如何使用 RDFLib 解析 .ttl 文件？

转载作者：太空狗更新时间：2023-10-29 21:40:23

24

4

我有一个 .ttl 格式的文件。它有 4 个属性/列，包含以下形式的四元组:

(id, student_name, student_address, student_phoneno)。
(id，faculty_name，faculty_address，faculty_phoneno)。

我知道如何使用 RDFLib 解析 .n3 形式的三元组；

from rdflib import Graph
g = Graph()
g.parse("demo.nt", format="nt")

但我不确定如何解析这些四元组。

我的目的是解析和提取与特定 ID 有关的所有信息。学生和教师的 ID 可以相同。

如何使用 RDFLib 处理这些四元组并将其用于基于 id 的聚合？

.ttl 文件中的示例片段:

#@ <id1>
<Alice> <USA> <12345>

#@ <id1>
<Jane> <France> <78900>

最佳答案

Turtle是 Notation 3 语法的子集，所以 rdflib应该能够使用 format='n3' 解析它。检查 rdflib 是否保留注释(id 在示例的注释 (#...) 中指定)。如果不是，并且输入格式与示例中所示的一样简单，那么您可以手动解析它:

import re
from collections import namedtuple
from itertools import takewhile

Entry = namedtuple('Entry', 'id name address phone')

def get_entries(path):
    with open(path) as file:
        # an entry starts with `#@` line and ends with a blank line
        for line in file:
            if line.startswith('#@'):
                buf = [line]
                buf.extend(takewhile(str.strip, file)) # read until blank line
                yield Entry(*re.findall(r'<([^>]+)>', ''.join(buf)))

print("\n".join(map(str, get_entries('example.ttl'))))

输出:

Entry(id='id1', name='Alice', address='USA', phone='12345')
Entry(id='id1', name='Jane', address='France', phone='78900')

将条目保存到数据库:

import sqlite3

with sqlite3.connect('example.db') as conn:
    conn.execute('''CREATE TABLE IF NOT EXISTS entries
             (id text, name text, address text, phone text)''')
    conn.executemany('INSERT INTO entries VALUES (?,?,?,?)',
                     get_entries('example.ttl'))

如果您需要在 Python 中进行一些后处理，则按 id 分组:

import sqlite3
from itertools import groupby
from operator import itemgetter

with sqlite3.connect('example.db') as c:
    rows = c.execute('SELECT * FROM entries ORDER BY id LIMIT ?', (10,))
    for id, group in groupby(rows, key=itemgetter(0)):
        print("%s:\n\t%s" % (id, "\n\t".join(map(str, group))))

输出:

id1:
    ('id1', 'Alice', 'USA', '12345')
    ('id1', 'Jane', 'France', '78900')

关于python - 如何使用 RDFLib 解析 .ttl 文件？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/15171802/

24

4

0

文章推荐： python - 如果没有重叠，与 MultiIndex 的内部连接失败

文章推荐： c# - 编写报告进度的方法

文章推荐： c# - C# 中具有多个泛型类型的泛型会导致允许和不允许的歧义

文章推荐： python - 如何使用 NumPy+MKL 避免这种四行内存泄漏？

rdflib - 找不到记录器 "rdflib.term"的处理程序
我在我的 python 模块中使用 rdflib-4.0.1 和 rdfextras-0.4。我在将数据加载到 rdfstore 时收到以下消息: No handlers could be foun
rdflib - 无法让 RDFlib 在 Windows 上工作
我已经安装了 RDFlib 3.0 和所有需要的东西，但是当我运行以下代码时出现错误。以下代码来自:http://code.google.com/p/rdflib/wiki/IntroSparql .
namespaces - rdflib 程序可以使用用户定义的本体吗
不确定这是否是一个愚蠢的问题，但我正在寻找一个使用的示例程序 rdflib 与本地本体一起使用。我看到很多使用像 FOAF 这样的标准本体的例子，但我想编写一个 python 程序，它可以在本地机器
python rdflib 传递查询
我对使用 rdflib 相当陌生，我的问题相当简单。我有几个 n-triple 文件，其中包含相当多的数据，虽然每个文件的主题都有相同的域，但每个文件的对象中的域都不同。现在我想输入一个或多个文件，并
python - RDFlib:将三元组批量添加到图形
我正在解析三元组文件并将三元组添加到我的本地三元组存储中。代码片段: graph = ConjunctiveGraph('Sleepycat') graph.open("mytriplestore"
python - rdflib - 查询持久性存储
我对链接数据和 rdflib 很陌生，我很迷茫。我正在尝试使用 rdflib 与“Sleepycat”建立持久性存储以加载 DBLP 数据库 rdf 文件，然后开始查询它。这就是我所做的: impor
python - RDFLib 空白节点打印
我有一个 RDF 数据集，其中三元组以 N-Triples 格式存储，如下所示: . _:AmapX3aXcountryX5fXcountryX5fXnameX5fXclassMapX40XX4
Python rdflib 无法正确解析知识共享许可信息
我使用的是 rdflib 版本 3.2.3，一切正常。升级到 4.0.1 后我开始收到错误: RDFa parsing Error! 'ascii' codec can't decode byte 0
Python rdflib 嵌套元素
我有一个现有的 rdf 图，我想修改它。我想在 n 变量中添加信息。 # source graph g = source.graph #new entry n = (URIRef(obj.pid),
python - RDFLib 中的命名空间绑定(bind)
在以下最小测试用例中: from rdflib import Graph, Namespace, Literal, RDF base = "http://test.com/ns" foobar = N
python - 有没有办法在 rdflib 中迭代地将列表添加到图形中？
我有一些文字列表，我想将它们作为 rdf:lists 添加到图表中。我可以使用 rdflib.collection.Collection 毫无问题地读取 rdf:lists，但我无法将这些列表添加到其
python - 在 RDFLIB 中使用前缀
我想使用短前缀来指定 rdflib 中的命名空间，但我遇到了麻烦。我想答案一定很简单。这是有问题的代码: g = rdflib.parse("some_rdf.rdf") rdf=rdflib.Nam
python - 强制 rdflib 定义命名空间
我开始使用 rdflib 库在 Python 中处理 rdf 数据。目前，我想创建一些 rdf 图的 .n3 文件，如下所示: @prefix ns1: . @prefix ns2: @prefi
python - 如何在 RDFLib 中为图形添加注释或标签？
我正在尝试将数据集的名称添加到图形对象并稍后检索它们，很确定必须有简单的方法来完成它，但到目前为止找不到任何东西......谢谢最佳答案我认为您正在寻找的是将上下文附加到图形。这就像创建一个图来解
python - 在 rdflib 中批量编辑三元组的主题
我通过使用 rdflib-jsonld 解析数据库中的记录来创建 rdflib 图。但是，三元组的主题在 url 中缺少 /。要添加它，我使用以下代码: for s,p,o in graph1:
python - rdflib 图未更新。为什么？
我正在尝试理解这种行为。这绝对不是我所期望的。我有两个程序，一个阅读器和一个编写器。读者打开一个RDFlib graph store，然后每2秒执行一次查询 import rdflib import
python - 为什么我的查询无法使用 RDFlib 运行
我一直在尝试使用 RDFlib (SPARQL) 查询 OWL 数据，但我不明白为什么它不起作用。我在 Protege(SPARQL 查询)中测试了相同的查询，它运行得很好!这是我的代码: impor
python - 使用 rdflib 打印出本体中每个概念的个体
我有一个用 OWL/RDF 编写的本体(使用 Protege)。这个本体已经为每个概念填充了一些个体。我已经使用 rdflib 和 FuXi 包将它移植到 python 中。我可以成功地解析我的本体并
python - 使用 rdflib 获取数据库中的所有关系
假设我在 mongoDB 中有某种集合，我想使用 rdflib 创建具有所有可能关系的图形。例如，如果我的数据库中有 3 个条目: FIRST{color:red, name:Ben, age: 29
python - 如何以可读的方式从 rdflib 打印术语文字？
我刚开始使用 rdflib，我有一个程序需要获取一个人的出生日期(在本例中为 Lewis Carroll)。我的程序会这样做，但是当我尝试打印它打印的日期时:(rdflib.term.Literal(

首页

博学

6Ren·AI

商城

python - 如何使用 RDFLib 解析 .ttl 文件？