smi*_*4fx 8 freebase sparql mql triplestore 4store
我目前正计划一个包含大数据的大项目.
我已经使用了搜索,所有结果告诉我,如果不使用第三方工具(如BaseKB或Freebase)到RDF,就无法将Freebase导入任何三元组
正如我所看到的,转储已经可以作为RDF使用,那么如果我想将转储导入到我的4store triplestore并通过SPARQL访问数据,那么问题出在哪里?
对于在导入 Freebase 转储时遇到问题的每个人:
1) 保持 RDF/Turtle 解析器更新。(最新版本的 raptor 2 可以识别“.”,例如 ns:common.topic.notable_for.example
2) 导入之前必须清理转储。我使用了这个脚本:http ://people.apache.org/~andy/Freebase20121223/ (修复)
3) Turtle 规范只允许 URI 使用以下字符:
::= '<' ([^#x00-#x20<>\"{}|^`\] | UCHAR)* '>'
Run Code Online (Sandbox Code Playgroud)
因此,将此行添加到 fixit 脚本的第 80 行非常重要:
$X =~ s/\\>/%3E/g ;
$X =~ s/\\.//g ;
# Add this Line
$X =~ [\x00-\x20\<\>\"\{\}\|\^\`] ;
$obj = "<".$X.">" ;
Run Code Online (Sandbox Code Playgroud)
结果,无效语法如下:
<http://www.wikipedia.org/object?key={invalid_braces}>
Run Code Online (Sandbox Code Playgroud)
变成
<http://www.wikipedia.org/object?key=invalid_braces>
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1017 次 |
| 最近记录: |