在 git bash 中使用 awscli,命令
aws s3 ls "s3://directory/"
Run Code Online (Sandbox Code Playgroud)
返回一个列表
PRE "filename"
Run Code Online (Sandbox Code Playgroud)
这很不方便,因为我需要对输出执行进一步的命令,而且我只需要给定目录中的文件/目录名称。
例如,能够执行以下操作会很好:
for dir in $(aws s3 ls s3://directory/) do
aws s3 ls $dir | grep .json;
done
Run Code Online (Sandbox Code Playgroud)
有什么建议可以解决这个问题吗?
大规模数据架构的问题当然是一个很大的话题,我远非专家。但是,我对如何大规模使用 JSON-LD 感兴趣,因此请原谅缺乏特异性和高级问题。
显然,像谷歌这样的大玩家在谷歌知识图谱中加入了 JSON-LD。
以此为例,假设知识图谱中I/O的数据格式为JSON-LD,那么数据库是如何构建的,才能查询到如此海量的数据?它是否依赖于转换为 RDF 三元组以使用 SPARQL 进行查询,或者是否有其他架构可以以原始 JSON-LD 格式查询数据?有哪些技巧(如果有的话)可以大规模处理(和查询)JSON-LD?
MongoDB 或 Virtuoso(?) 等系统可用于管理大型 JSON 格式的数据并使其可查询,但是否需要将 JSON(-LD) 指定为数据的后端格式而不是 xml(如果人们希望使用某种 RDF)?
再次,为含糊不清而道歉。任何输入,例如关于该主题的一般指示或讨论,将不胜感激。
semantic-web semantic-markup nosql json-ld google-knowledge-graph