背景:
我有一个PostgreSQL(v8.3)数据库,它针对OLTP进行了大量优化.
我需要半实时地从中提取数据(有些人必然要问半实时意味着什么,答案是我合理的频率但是我会务实,因为基准可以说我们希望每15分钟一次并将其送入数据仓库.
多少数据?在高峰时段,我们正在谈论每分钟大约80-100k行击中OLTP侧,非高峰时这将大幅下降到15-20k.最频繁更新的行每个约64个字节,但有各种表等,因此数据非常多样化,每行最多可达4000个字节.OLTP处于活动状态24x5.5.
最佳方案?
从我可以拼凑起来的最实用的解决方案如下:
为什么这种做法?
考虑的替代方案......
有没有人这样做过?想分享你的想法?
postgresql etl near-real-time data-warehouse data-extraction
我想在yEd创建的graphml文件中获取所有节点和一些属性(例如标签名称)的列表,而不管它们在图形中的位置.这与已经部分地处理(在蟒蛇networkx处理XML文件和如何循环GraphML与LXML文件),但不是当内YED你"团"节点-和我有很多分组分组内.
尝试过networkx和lxml,但没有使用建议的简单方法获得完整的结果集 - 任何关于优雅解决方法的建议以及使用哪个库都不能递归地迭代树并识别组节点并再次向下钻取.
例:
当您有分组时,使用networkx的非常简单的图表的示例输出:
('n0', {})
('n1', {'y': '0.0', 'x': '26.007967509920633', 'label': 'A'})
('n0::n0', {})
('n0::n1', {})
Run Code Online (Sandbox Code Playgroud)
