标签: triplestore

我完全爱上了Freebase.我现在想要的是基本上创建一个非常简单的Freebase克隆,用于存储可能不属于Freebase本身的内容,但可以使用Freebase架构进行描述.基本上我想要的是一种简单而优雅的方式来存储像Freebase本身那样的数据,并且能够在Python(CherryPy)Web应用程序中轻松使用这些数据.

MQL参考指南的第2章指出:

作为Metaweb基础的数据库与您可能熟悉的关系数据库根本不同.关系数据库以表的形式存储数据,但Metaweb数据库将数据存储为节点图和这些节点之间的关系.

我想这意味着我应该使用三重存储或图形数据库,如Neo4j？这里有人有使用Python环境中任何一种的经验吗？

(到目前为止我实际尝试的是创建一个能够轻松存储Freebase主题的关系数据库模式,但是我遇到了在SQLAlchemy中配置映射的问题).

我正在研究的事情

更新[28/12/2011]:

我在Freebase博客上发现了一篇文章,描述了Freebase自己使用的专有元组存储/数据库(图形):http://blog.freebase.com/2008/04/09/a-brief-tour-of-graphd/

python database-design rdf freebase triplestore

Bru*_*oij

2017 05-23

7
推荐指数

3
解决办法

4174
查看次数

这大约是61,000,000三倍.Virtuoso应该能够轻松处理更多,但每次都会在大约40,000,000三倍之后停止加载.我正在使用Amazon EC2的双超大实例,它有30 GB的RAM,还有足够的存储空间.我的配置文件有问题吗？我正在使用ubuntu服务器12.04,我已经尝试通过apt-get(版本6.1.5)安装Virtuoso 并根据JörnHees的指示从github(版本6.1.6)编译最新的稳定源代码.

我也尝试将dumpfile分成小块并逐个加载它们.在插入大约40,000,000个三元组后,这也会崩溃.

日志文件没有显示任何奇怪的内容; virtuoso-t只是在没有实际崩溃的情况下停止工作,并top使用0%的CPU显示进程.在前半个小时左右之后,我已经让这个过程运行了好几天没有任何进展.

这是我的virtuoso.ini档案:

[Database]
DatabaseFile            = /var/lib/virtuoso/db/virtuoso.db
ErrorLogFile            = /var/lib/virtuoso/db/virtuoso.log
LockFile            = /var/lib/virtuoso/db/virtuoso.lck
TransactionFile         = /var/lib/virtuoso/db/virtuoso.trx
xa_persistent_file      = /var/lib/virtuoso/db/virtuoso.pxa
ErrorLogLevel           = 7
FileExtend          = 200
MaxCheckpointRemap      = 625000
Striping            = 0
TempStorage         = TempDatabase


[TempDatabase]
DatabaseFile            = /var/lib/virtuoso/db/virtuoso-temp.db
TransactionFile         = /var/lib/virtuoso/db/virtuoso-temp.trx
MaxCheckpointRemap      = 2000
Striping            = 0


;
;  Server parameters
;
[Parameters]
ServerPort          = 1111
LiteMode            = 0
DisableUnixSocket       = …

Run Code Online (Sandbox Code Playgroud)

rdf semantic-web triplestore virtuoso n-triples

ail*_*nlv

2015 12-23

7
推荐指数

1
解决办法

1404
查看次数

django RDF支持？

我正在寻找一种有助于为Django项目提供RDF支持的工具.

到目前为止,我发现了两个:

django-rdf - 最后修改是4个以前所以它看起来像一个死项目.
djubby - 看起来像一个全有或全无的项目 - 要么你创建你的django应用程序作为一个完全面向RDF的软件,没有任何其他网址或你只是不能使用它.

我正在寻找其他替代方案,你知道吗？

django rdf semantic-web sparql triplestore

mno*_*tka

lucky-day

7
推荐指数

1
解决办法

3081
查看次数

triplestore数据库有哪些优点和缺点？

Mulgara等三重库存数据库有哪些优点和缺点？在哪些情况下,其性能与传统关系数据库的性能有很大不同？

我特别想到你在表单中有数据的情况namespace:predicate=value.Triplestores似乎将数据保持为"自然"形式,但我想知道除此之外是否还有其他特定优势.

database performance rdf triplestore

M. *_*ley

2009 06-15

6
推荐指数

2
解决办法

3034
查看次数

三重商店与修订

我需要存储RDF三元组,同时跟踪修改.这项服务有什么吗？或者,在使用上下文感知的三元组时,您将如何跟踪修订？

编辑:请注意我不需要变更集.我也需要在过去的任何时候看到三元组.

revision rdf triplestore

Ste*_*ini

2010 01-22

6
推荐指数

1
解决办法

1131
查看次数

Android上的RDF数据库

我正在开发一个Android移动RDF数据库项目.因此,我正在寻找包含在我的Android项目中的开源数据库.但是,我很难找到现有RDF数据库的移动版本.

到目前为止我发现了什么:

耶拿TDB数据库
Oracle Berkeley数据库

不幸的是我还没有找到Sesame,Virtuoso,AllegroGraph等的移动版本.

有谁知道Android的其他一些RDF数据库？

database android rdf semantic-web triplestore

kan*_*iny

2012 04-16

6
推荐指数

1
解决办法

1308
查看次数

Marklogic 7:语义搜索

我一直在尝试探索Marklogic 7的RDF三重存储功能和语义搜索功能,然后使用SPARQL进行查询.我能够执行一些基本操作,例如:

xquery version "1.0-ml";
import module namespace sem = "http://marklogic.com/semantics"at"/MarkLogic/semantics.xqy";
sem:rdf-insert(sem:triple(sem:iri("http://example.org/ns/people#m"),
sem:iri("http://example.com/ns/person#firstName"), "Sam"),(),(),"my collection")

Run Code Online (Sandbox Code Playgroud)

创建一个三元组,然后使用以下SPARQL查询它:

PREFIX ab: <http://example.org/ns/people#>
PREFIX ac: <http://example.com/ns/person#>
SELECT ?Name
WHERE
{ ab:m ac:firstName ?Name . }

Run Code Online (Sandbox Code Playgroud)

它会检索Sam作为结果. 编辑:在我的用例中,我有一个带有10亿条记录的分隔文件(结构化数据),我使用MLCP将其记录到ML中,MLCP存储在ML中,例如:

<root>
<ID>1000-000-000--000</ID>
<ACCOUNT_NUM>9999</ACCOUNT_NUM>
<NAME>Vronik</NAME>
<ADD1>D7-701</ADD1>
<ADD2>B-Valentine</ADD2>
<ADD3>Street 4</ADD3>
<ADD4>Fifth Avenue</ADD4>
<CITY>New York</CITY>
<STATE>NY</STATE>
<HOMPHONE>0002600000</HOMPHONE>
<BASEPHONE>12345</BASEPHONE>
<CELLPHONE>54321</CELLPHONE>
<EMAIL_ADDR>abc@gmail.com</EMAIL_ADDR>
<CURRENT_BALANCE>10000</CURRENT_BALANCE>
<OWNERSHIP>JOINT</OWNERSHIP>
</root>

Run Code Online (Sandbox Code Playgroud)

现在,我想在上面的数据集中使用RDF/Semantic功能.但是,我无法理解是否需要将上述doc转换为RDF,如下所示(显示为<NAME>),假设这是正确的方法:

  <sem:triple>
    <sem:subject>unique/uri/Person
    </sem:subject>
    <sem:predicate>unique/uri/Name
    </sem:predicate>
    <sem:object datatype="http://www.w3.org/2001/XMLSchema#string"
    xml:lang="en">Vronik
    </sem:object>
  </sem:triple> …

Run Code Online (Sandbox Code Playgroud)

rdf semantic-web marklogic triplestore

Shr*_*vam

2013 11-20

6
推荐指数

1
解决办法

883
查看次数

仅当对象是文字时才按语言过滤

我写了以下查询:

SELECT DISTINCT
  ?predicate
  ?object
  ?label
WHERE {
  VALUES        ?subject     { <http://dbpedia.org/resource/Hercules_(1997_film)> }
  ?subject      ?predicate   ?object .
  ?predicate    rdfs:label   ?label .
  FILTER(langMatches(lang(?object), "EN"))
}
LIMIT 100

Run Code Online (Sandbox Code Playgroud)

当我用FILTER这种方式写行时,我基本上过滤掉了所有非文字(侧面问题:文字是唯一可以有语言标签的类型吗？)

那么,我如何保留所有结果并过滤掉非英语文字呢？

database rdf sparql triplestore

Kri*_*ian

lucky-day

6
推荐指数

1
解决办法

435
查看次数