小编Pey*_*ton的帖子

比较(和合并)两个VS C#项目

我有两个VS C#项目(特别是对于一个Outlook插件)我认为非常相似,除了100行代码.我有点担心项目可能有其他不同的配置选项,所以我想比较这两个.

查看两个代码库之间差异的最佳方法是什么？

我已经尝试将这两个项目放在并行目录中并使用diff,但由于项目的命名方式不同,因此某些文件不匹配.我只是想知道是否有更简单的方法来做到这一点？

c# diff visual-studio

Pey*_*ton

lucky-day

8
推荐指数

2
解决办法

1万
查看次数

文件相似性非常快

我试图尽快确定单个文档与大量文档(n~ = 100万)之间的文档相似性.更具体地说,我正在比较的文件是电子邮件; 它们被分组(即,有文件夹或标签),我想确定哪个组最适合新的电子邮件.快速的性能至关重要.

我的先验假设是术语向量之间的余弦相似性适合于这种应用; 请评论这是否是一个好用的措施!

我已经考虑了以下加速性能的可能性:

预标准化所有术语向量
计算每个组的术语向量(n~ = 10,000)而不是每封电子邮件(n~ = 1,000,000); 这可能是我的申请可以接受的,但如果你能想到不这样做的理由,请告诉我!

我有几个问题:

如果新电子邮件中有一个以前从未见过的新电子邮件,这是否意味着我需要重新计算所有的术语向量？这看起来很贵.
是否有一些聪明的方法只考虑可能接近查询文档的向量？
有没有什么方法可以更节俭地用于所有这些向量的内存量？

谢谢!

performance search trigonometry similarity

Pey*_*ton

lucky-day

5
推荐指数

1
解决办法

1398
查看次数

哪个是合适的数据结构？

我需要一个Java数据结构,它具有:

快速(O(1))插入
快速清除
快速(O(1))max()功能

什么是最好的数据结构？

HashMap几乎可以工作,但使用java.util.Collections.max()的地图大小至少为O(n).TreeMap的插入和删除速度太慢.

有什么想法吗？

java algorithm data-structures

Pey*_*ton

2011 05-13

5
推荐指数

2
解决办法

1573
查看次数

标签统计

algorithm ×1

c# ×1

data-structures ×1

diff ×1

java ×1

performance ×1

search ×1

similarity ×1

trigonometry ×1

visual-studio ×1

比较(和合并)两个VS C#项目

文件相似性非常快

哪个是合适的数据结构？

标签 统计

小编Pey_ton的帖子

标签统计