我们正在寻找一种报告应用程序,该应用程序报告存储在大量XML文件中的数据.~3,000,000个文件,大小从7KB到5MB(每个文件符合相同的模式).我猜大约有200GB的XML.我正在研究一些开源XML数据库(Sedna,BaseX和eXist-db),我不确定这些系统的扩展程度,我在这里阅读了这三个数据库的比较.这是我对可伸缩性的关注源自哪里.
关于我们想要做的事情的一些细节是:我们不会更改任何XML文件中的数据,并且每天都会添加新文件.由于我们关注报告查询性能对我们很重要,因此添加和索引新文件所需的时间对我们来说不是一个高优先级.
我想知道是否有人有类似规模使用这些系统的经验?我查看了BaseX 统计信息页面,看到了一些相当大的XML实例,但没有提到性能.
我们不需要开源产品,MarkLogic系统看起来很适合这个账单,但我很好奇开源产品做了些什么.
我在https://github.com/facebook/rocksdb/wiki/Administration-and-Data-Access-Tool上阅读了有关RocksDB管理工具"ldb"的内容
但我只能找到leveldb的ldb repo:https: //github.com/0x00A/ldb
编译ldb后,我无法从提供的链接运行任何一个命令.
$ ldb -i ./db
Corruption: VersionEdit: unknown tag
Run Code Online (Sandbox Code Playgroud)
要么
$ ldb --db=./db
In excecutable 'ldb':
Unrecognized flag/option '--db=./db'
Run Code Online (Sandbox Code Playgroud)
我在哪里可以获得RocksDB的正确ldb管理工具,所以至少我可以浏览我现有的RocksDB?
谢谢,
我找不到任何现有的解决方案,因为我认为没有其他人使用过eXist-db来做到这一点.有人知道如何使用eXist-db中的SVG绘制条形图吗?
第一次约会:
DTD:
<?xml version="1.0" encoding="utf-8"?>
<!ELEMENT akweny (akwen+)>
<!ELEMENT akwen (nazwa, typ, powierzchnia, akweny?)>
<!ELEMENT nazwa (#PCDATA)>
<!ELEMENT typ (#PCDATA)>
<!ELEMENT powierzchnia (#PCDATA)>
Run Code Online (Sandbox Code Playgroud)
和XML例如:
<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE akweny SYSTEM "akweny.dtd">
<akweny>
<akwen>
<nazwa>Atlantycki</nazwa>
<typ>ocean</typ>
<powierzchnia>106450</powierzchnia>
<akweny>
<akwen>
<nazwa>Pó?nocne</nazwa>
<typ>morze</typ>
<powierzchnia>750</powierzchnia>
</akwen>
<akwen>
<nazwa>Batyckie</nazwa>
<typ>morze</typ>
<powierzchnia>386</powierzchnia>
<akweny>
<akwen>
<nazwa>Botnicka</nazwa>
<typ>zatoka</typ>
<powierzchnia>117</powierzchnia>
</akwen>
</akweny>
</akwen>
</akweny>
</akwen>
<akwen>
<nazwa>Spokojny</nazwa>
<typ>ocean</typ>
<powierzchnia>179700</powierzchnia>
</akwen>
</akweny>
Run Code Online (Sandbox Code Playgroud)
我知道eXist-db有一些XSLT转换函数,例如
transform:stream-transform($node-tree as node()*, $stylesheet as item(),
$parameters as node()?) as item()
Run Code Online (Sandbox Code Playgroud)
但是我怎么能用这个呢?我找不到任何例子.我不知道如何使用它......
这是我的链接:
bars.xq?nazwa=anyNazwa&typ=anyTyp&powierzchnia=100
Run Code Online (Sandbox Code Playgroud)
它应该表现出任何的nazwa …
你知道为什么下面的代码在ms sql server上是错误的吗?
DROP TABLE [IF EXISTS] database.table1,
create table table1 (...)
Run Code Online (Sandbox Code Playgroud) exist-db ×2
basex ×1
create-table ×1
exists ×1
rocksdb ×1
sedna ×1
sql ×1
sql-server ×1
svg ×1
xml-database ×1
xpath ×1
xquery ×1