我有两个列表(不是java列表,你可以说两列)
例如
**List 1** **Lists 2**
milan hafil
dingo iga
iga dingo
elpha binga
hafil mike
meat dingo
milan
elpha
meat
iga
neeta.peeta
Run Code Online (Sandbox Code Playgroud)
我想要一个返回多少元素相同的方法.对于这个例子,它应该是3,它应该返回类似的列表和不同值的值.
如果是,我应该使用hashmap然后用什么方法来获取我的结果?
请帮忙
PS:这不是学校的任务:)所以如果你只是指导我就足够了
我在java中寻找一个轻量级的集群库.我不需要在该库中使用100个聚类算法,只需5到7个算法就可以了.
我相信,你会问:"你需要什么样的算法和目的":).我只需要在聚类的帮助下对数据进行分类.例如K表示.
PS:我知道weka,但我不想使用它,因为它不仅仅专门用于聚类.
我制作了一个配置文件,它有一些以下格式
variableName = value
variableName = value
variableName = value
Run Code Online (Sandbox Code Playgroud)
我知道我可以读取文件,将它们存储在变量中.但我正在寻找一种简单的方法.例如,我想将变量名称及其值存储在一个文件中,我想在读取文件时自动恢复变量及其值.(我知道如何在PHP中做到这一点很容易,但我不是java专家:()
我的第二个问题是关于文件阅读.例如,我有一个包含行和列的文件,它可以是CSV
one,two,three
four,five,six
seven,eight,nine
Run Code Online (Sandbox Code Playgroud)
我想读它,它返回整列,例如(一个四七)与其他人相同.我不想仅仅为一个函数使用OpenCSV作为其非面向csv的应用程序.
编辑:
是否可以写入所有变量名称及其值,当我读取文件时,它会自动声明这些变量并赋值?
对不起,如果我的问题听起来很愚蠢:)你可以向我推荐任何伪代码或者在java中实现LSI的好算法吗?我不是数学专家.我试着在维基百科和其他网站上阅读一些关于LSI(潜在语义索引)的文章,他们充满了数学.我知道LSI充满了数学.但是,如果我看到一些源代码或算法.我更容易理解事情.这就是我在这里问的原因,因为有很多GURU在这里!提前致谢
我正在使用Junit 4.我的整个程序运行正常.我正在尝试编写测试用例.但是有一个错误......
这里是非常基本的样本测试
public class di extends TestCase{
private static Records testRec;
public void testAbc() {
Assert.assertTrue(
"There should be some thing.",
di.testRec.getEmployee() > 0);
}
}
Run Code Online (Sandbox Code Playgroud)
当我运行它时,它给我错误
fName can not be null
Run Code Online (Sandbox Code Playgroud)
如果我使用超级并且这样做
public TestA() {
super("testAbc");
}
Run Code Online (Sandbox Code Playgroud)
它工作得很好.以前不是用JUnit 3.X我做错了或者他们改了:(抱歉,如果我不清楚的话
有没有办法在没有超级的情况下执行测试?或调用功能等?
我有字符串比较的问题.例如,有这个字符串:
"hello world i am from heaven"
Run Code Online (Sandbox Code Playgroud)
我想搜索这个字符串是否包含"world".我使用了以下功能,但它们有一些问题.我曾经使用String.indexof()但如果我试图搜索"w"它会说它存在.
总之,我认为我正在寻找确切的比较.Java中有什么好的功能吗?
还有Java中的任何函数可以计算日志库2吗?
我计算了两个文件的tf/idf值.以下是tf/idf值:
1.txt
0.0
0.5
2.txt
0.0
0.5
Run Code Online (Sandbox Code Playgroud)
文件如下:
1.txt = > dog cat
2.txt = > cat elephant
Run Code Online (Sandbox Code Playgroud)
如何使用这些值来计算余弦相似度?
我知道我应该计算点积,然后通过它找到距离并除以点积.如何使用我的值来计算?
还有一个问题:两个文件应该有相同数量的单词是否重要?
我正在学习java。我正在尝试使用复合设计模式。我正在尝试使用以下逻辑。(别笑,我知道这是非常基本的:))
Item -> interface
Folder -> class
File -> class
Run Code Online (Sandbox Code Playgroud)
在文件夹类中,我可以创建一个Item的数组列表来存储文件信息吗?
ArrayList<Item> info = ArrayList<Item>();
Run Code Online (Sandbox Code Playgroud)
或者我应该使用文件夹Arraylist?
ArrayList<Folder> info = ArrayList<Folder>();
Run Code Online (Sandbox Code Playgroud)
我不知道接口是否可以存储真实数据,因为没有变量只有函数定义。
感谢您帮助新手:)
我使用tf/idf来计算两个文档之间的相似性.它有一些限制,但表现不佳.
我寻找LDA(潜在的dirichlet分配)来计算文档相似度.我对此并不了解.关于我的问题,我找不到太多东西.
能否请您提供与我的问题相关的任何教程?或者你能给出一些建议,我怎样才能用LDA实现这个任务?
谢谢
PS:还有任何可用于LDA执行此类任务的源代码吗?
我正在使用jama来计算 SVD。效果非常好。如果我通过方阵。例如 2x2 或 3x3 等矩阵。但是当我传递像 2x3 或 4x8 这样的东西时,它会给出错误。我使用了他们所有的例子。他们有不同的构造函数来执行这项工作。我的第二个问题是,我使用 3x3 矩阵,它给出了
double[][] vals = {{1.,1.,0},{1.,0.,1.},{1.,3.,4.},{6.,4.,8.}};
Matrix A = new Matrix(vals);
Run Code Online (Sandbox Code Playgroud)
它产生了以下错误:
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 3
Run Code Online (Sandbox Code Playgroud)
之后我想使用另一个构造函数,如下所示
double[][] vals = {{1.,1.,0,4},{1.,0.,1.,2},{1.,3.,4.,8},{1.,3.,4.,8}};
Matrix A = new Matrix(vals,4,3);
Run Code Online (Sandbox Code Playgroud)
它产生以下输出:
A =
1.0 1.0 0.0
1.0 0.0 1.0
1.0 3.0 4.0
6.0 4.0 8.0
A = U S V^T
U =
0.078 -0.115 -0.963
0.107 -0.281 0.260
0.402 0.886 -0.018
0.906 -0.351 0.060
Sigma =
11.861881 0.000000 0.000000
0.000000 …Run Code Online (Sandbox Code Playgroud) java ×10
math ×4
algorithm ×1
comparison ×1
dirichlet ×1
dot-product ×1
hashmap ×1
jama ×1
junit ×1
list ×1
matrix ×1
similarity ×1
string ×1
testcase ×1
tf-idf ×1
trigonometry ×1
unit-testing ×1