我已经下载并启动了Cloudera的Hadoop Demo VM for CDH4(运行Hadoop 2.0.0).我正在尝试编写一个将从我的Windows 7机器运行的Java程序(与运行VM的机器/操作系统相同).我有一个示例程序,如:
public static void main(String[] args) {
try{
Configuration conf = new Configuration();
conf.addResource("config.xml");
FileSystem fs = FileSystem.get(conf);
FSDataOutputStream fdos=fs.create(new Path("/testing/file01.txt"), true);
fdos.writeBytes("Test text for the txt file");
fdos.flush();
fdos.close();
fs.close();
}catch(Exception e){
e.printStackTrace();
}
}
Run Code Online (Sandbox Code Playgroud)
我的config.xml文件只定义了属性:fs.default.name = hdfs:// CDH4_IP:8020.
当我运行它时,我得到以下异常:
org.apache.hadoop.ipc.RemoteException(java.io.IOException): File /testing/file01.txt could only be replicated to 0 nodes instead of minReplication (=1). There are 1 datanode(s) running and 1 node(s) are excluded in this operation.
at org.apache.hadoop.hdfs.server.blockmanagement.BlockManager.chooseTarget(BlockManager.java:1322)
at org.apache.hadoop.hdfs.server.namenode.FSNamesystem.getAdditionalBlock(FSNamesystem.java:2170)
at org.apache.hadoop.hdfs.server.namenode.NameNodeRpcServer.addBlock(NameNodeRpcServer.java:471) …Run Code Online (Sandbox Code Playgroud) 我正在Windows机器上的独立tomcat 6服务器上运行应用程序.我希望它能够从DoD CAC卡请求和接收客户端证书.
我有一台运行IE的客户机正确设置从CAC卡传递证书,我知道它是正确的,因为当我去CAC启用的网站时,IE会弹出一个窗口,要求我选择一个证书,在那个窗口我看到来自我的CAC卡的证书.
我有tomcat配置为从用户请求证书,当我导航到我在tomcat上运行的站点时,我看到同样的IE提示要求我选择我的证书,但是当我查看我的站点时,证书列表是空的.在我的server.xml文件中,我已经配置了我的连接器,如下所示:
<Connector port="8443"
protocol="HTTP/1.1"
SSLEnabled="true"
maxThreads="150"
scheme="https"
secure="true"
keystoreFile="<myKeysotre>"
keystorePass="<myPassword>"
clientAuth="want"
sslProtocol="TLS" />
Run Code Online (Sandbox Code Playgroud)
我认为我搞砸的地方是生成密钥库文件.现在我使用java keytool命令生成它,如下所示:
keytool -genkey -alias -keypass myPassword -keystore myKeystore -storepass myPassword
我正在进行开发,我正在寻找一种方法来将CAC卡的客户端证书提供给我的应用程序,但我遗漏了一些东西.我不太熟悉它是如何工作的所以我可以使用一些帮助/指导.
谢谢
我们正在寻找一种报告应用程序,该应用程序报告存储在大量XML文件中的数据.~3,000,000个文件,大小从7KB到5MB(每个文件符合相同的模式).我猜大约有200GB的XML.我正在研究一些开源XML数据库(Sedna,BaseX和eXist-db),我不确定这些系统的扩展程度,我在这里阅读了这三个数据库的比较.这是我对可伸缩性的关注源自哪里.
关于我们想要做的事情的一些细节是:我们不会更改任何XML文件中的数据,并且每天都会添加新文件.由于我们关注报告查询性能对我们很重要,因此添加和索引新文件所需的时间对我们来说不是一个高优先级.
我想知道是否有人有类似规模使用这些系统的经验?我查看了BaseX 统计信息页面,看到了一些相当大的XML实例,但没有提到性能.
我们不需要开源产品,MarkLogic系统看起来很适合这个账单,但我很好奇开源产品做了些什么.