TTL文件格式 - 我不知道这是什么

Dav*_*eAl 1 xml json file graph turtle-rdf

我有一个具有结构的文件,但我不知道它是什么格式,也不知道如何解析它.文件扩展名是ttl,但我以前从未遇到过这个问题.

文件中的某些行如下所示:

<http://data.europa.eu/esco/label/790ff9ed-c43b-435c-b6b3-6a4a6e8e8326>
    a                   skosxl:Label ;
    skosxl:literalForm  "gérer des opérations d’allègement"@fr .

<http://data.europa.eu/esco/label/98570af6-b237-4cdd-b555-98fe3de26ef8>
    a                   skosxl:Label ;
    esco:hasLabelRole   <http://data.europa.eu/esco/label-role/neutral> , <http://data.europa.eu/esco/label-role/male> , <http://data.europa.eu/esco/label-role/female> ;
    skosxl:literalForm  "particleboard machine technician"@en .

<http://data.europa.eu/esco/label/aaac5531-fc8d-40d5-bfb8-fc9ba741ac21>
    a                   skosxl:Label ;
    esco:hasLabelRole   "http://data.europa.eu/esco/label-role/female" , "http://data.europa.eu/esco/label-role/standard-female" ;
    skosxl:literalForm  "pracovnice denní pé?e o d?ti"@cs .
Run Code Online (Sandbox Code Playgroud)

它继续这样400多MB.对于某些节点,但不是所有节点,都添加了附加属性.

它让我想起了某种形式的XML,但是我没有太多使用不同格式的经验.它看起来像是一个可以作为图形的模型.你知道它是什么数据格式,以及我如何在python中解析它?

小智 6

这看起来像乌龟——一种用于语义网的数据描述语言。

:has 标签和 :label 是为定义为共享数据的两个不同语义库指定的(esco 和 skosxl 使用搜索引擎查找这些库应该没有太大问题,假设数据位于语义网络中)。:literal 形式可以被认为是 XML 标记中的值。

它们在数据结构中表示本体:

主题:10 谓词:名称对象:约翰

对于python,将数据作为文件读取,将主题作为字典的键,将值放入数据库中,不清楚您想对数据做什么。

语义数据是开放的、不完整的,并且可能具有不寻常的复杂结构。上面的例子非常简单,上面链接的引物可能会有所帮助。


Hen*_*mse 6

是的,@ Phil是正确的,它是用于存储RDF数据的龟语法.

我建议你将它导入某种RDF存储,而不是尝试自己解析400MB +.您可以使用GraphDB,Blazegraph,Virtuso等列表.搜索RDF商店应该提供许多其他选项.

然后,您可以使用SPARQL使用Python RDFlib查询RDF存储(类似于关系数据库的SQL).这是RDFLib的一个例子.