小编vig*_*mar的帖子

当配置多个目录时,cassandra如何分割键空间数据?

我在cassandra.yaml文件中配置了三个单独的数据目录,如下所示:

data_file_directories:
    - E:/Cassandra/data/var/lib/cassandra/data
    - K:/Cassandra/data/var/lib/cassandra/data

当我创建密钥空间并插入数据时,我的密钥空间在两个目录中都被创建,数据被分散了.我想知道的是cassandra如何在多个目录之间分割数据?这背后的规则是什么?

cassandra

8
推荐指数
1
解决办法
7172
查看次数

在java中的file.lists()中排除系统文件

我正在使用方法的文件列表File.listFiles()java.io.File,但它返回一些系统文件,比如(.sysetc)......我需要排除所有系统相关的文件(Windows,Linux和苹果机)在返回列表.任何人都可以解决我的问题吗?

java file-io

6
推荐指数
1
解决办法
4747
查看次数

计算IDF(反向文档频率)以进行文档分类

我对在文档分类中计算IDF(逆文档频率)有疑问.我有多个类别,包含多个培训文档.我使用以下公式计算文档中每个术语的IDF:

IDF(t,D)=log(Total Number documents/Number of Document matching term);
Run Code Online (Sandbox Code Playgroud)

我的问题是:

  1. "语料库中的文件总数"是什么意思?文档是从当前类别还是从所有可用类别计算?
  2. "文件匹配项数"是什么意思?匹配文档的术语是从当前类别还是从所有可用类别中计算的?

information-retrieval machine-learning tf-idf categorization document-classification

5
推荐指数
1
解决办法
5532
查看次数

从本地驱动器识别映射的驱动器

我正在使用Java中的File.listRoots()列出我桌面上的所有可用驱动器.我有一些Mapped驱动器.当我列出根时,它会提取本地驱动器以及映射驱动器.为了排除我在代码片段后面使用的映射驱动器:

for (File drive :File.listRoots()){
   String typeDescription = FileSystemView.getFileSystemView().getSystemTypeDescription(drive);
}
Run Code Online (Sandbox Code Playgroud)

基于返回的类型描述,我正在过滤驱动器.但这不是普遍的标准,也不被其他操作系统接受.仅支持Windows.还有语言限制(仅支持英语类型说明).任何人都可以给我任何其他解决方案来全局过滤映射的驱动器.

注意:
它必须特定于JDK1.6

java java-io

5
推荐指数
1
解决办法
933
查看次数

如果仅在插入问题时禁用压缩怎么办?

     在cassandra中,当很多版本的列分散在不同的SSTables中时,需要进行压缩以便更快地进行查询检索.当完成相同列或删除的更新序列时,压缩是最佳策略.但压实是一个繁重的资源利用过程.但在我的应用程序中,我只使用Cassandra插入记录并查看它们.但密钥空间大小可能会以GB为单位增长.它将拥有超过数百万条记录.对我来说,插入只是重要的.我不打算更新列或删除列.我的简单删除将在整个密钥空间.现在我怀疑是否可以禁用压缩?压缩禁用会降低查询性能吗?

cassandra

3
推荐指数
1
解决办法
176
查看次数

一般SVM实施

   我想学习使用QP问题进行培训的一般SVM实现.最初我不想学习顺序最小优化(SMO)类型的算法,这种算法超出了QP矩阵大小问题.任何人都可以给我一些参考,以学习任何编程语言(如C,C++或Java)中的Pure General SVM实现.这样我就可以理解SVM中的基本问题,它将帮助我学习一些其他SVM优化算法.

machine-learning svm

1
推荐指数
1
解决办法
1958
查看次数