我有一个非常巨大的xml(> 10mb大小和40+元素).目前,我们将此类xml存储在Oracle数据库中,并使用xquery查询和检索部分xml.此过程很慢,需要多次db调用.我们正在探索mongodb来存储这个xml并进行查询.我justed将xml转换为json并加载到mongo集合中,它将巨大的json数据存储在flash中.它将xml节点存储为嵌套文档.但是当我查询(使用find)最内层元素时,它总是返回整个doc,包含具有不匹配元素值的节点.我希望只有少数节点匹配给定的节点值.如果有最好的方法在mongo db中存储这么大的xml文件,请告诉我.并且还让我知道如何检索具有查询中指定的确切值的内部节点.提前致谢.
我想在5台机器的hadoop集群中运行Mahout的K-Means示例.我需要在所有节点中保留哪些Mahout jar文件,以便以分布式方式执行K-Means.谢谢.
-Venkiram