标签: similarity

计算单词列表之间的相似度

我想计算两个单词列表之间的相似度,例如:

['email','user','this','email','address','customer']

类似于这个列表:

['email','mail','address','netmail']

我希望比另一个列表具有更高的相似度百分比,例如: ['address','ip','network']即使address存在于列表中。

python similarity data-mining text-mining

2
推荐指数
2
解决办法
8341
查看次数

在python中测量两个rgb图像之间的相似性

我有两个相同大小的 rgb 图像,我想计算一个相似性度量。我想从欧几里得距离开始:

import scipy.spatial.distance as dist
import cv2

im1 = cv2.imread("im1.jpg")
im2 = cv2.imread("im2.jpg")

>> im1.shape
(820, 740, 3)

>> dist.euclidean(im1,im2)

ValueError: Input vector should be 1-D.
Run Code Online (Sandbox Code Playgroud)

我知道dist.euclidean需要一个1-d阵列和im1im2是3-d,但有将与3-d阵列工作,或者是否有可能变换函数im1im2到1-d阵列蜜饯在图像中的信息?

python similarity euclidean-distance

2
推荐指数
1
解决办法
3598
查看次数

C#比较相似的字符串

我有一些带有一些文件名(LIST1)的泛型和另一个带有完整名称列表的大型通用(LIST2).我需要将LIST1中的名称与LIST2中的类似名称相匹配.例如

LIST1
- **MAIZE_SLIP_QUANTITY_3_9.1.aif**

LIST 2
1- TUTORIAL_FAILURE_CLINCH_4.1.aif
2- **MAIZE_SLIP_QUANTITY_3_5.1.aif**
3- **MAIZE_SLIP_QUANTITY_3_9.2.aif**
4- TUTORIAL_FAILURE_CLINCH_5.1.aif
5- TUTORIAL_FAILURE_CLINCH_6.1.aif
6- TUTORIAL_FAILURE_CLINCH_7.1.aif
7- TUTORIAL_FAILURE_CLINCH_8.1.aif
8- TUTORIAL_FAILURE_CLINCH_9.1.aif
9- TUTORIAL_FAILURE_PUSH_4.1.aif
Run Code Online (Sandbox Code Playgroud)

我已经阅读了Levenshtein距离并在框架(SignumFramework Utilities)中使用了它的实现. 它在第2行和第3行返回距离= 1.但在我的情况下,第3行比第2行更好.

还有另一种方法可以比较相似的字符串吗?更灵活的东西?

c# string compare similarity

1
推荐指数
1
解决办法
7810
查看次数

检测两个视频文件中的相似度

我正在研究用Java检测2个视频之间的相似性.用户将建议两个视频,软件必须通过检查文件内容来检测它们是否相似.我读到可以比较2个视频的每个帧.任何人都可以分享可以用Java实现的任何合适的算法(或代码或方法)吗?

java video similarity detection

1
推荐指数
1
解决办法
4355
查看次数

连续,非二进制数据的简单匹配相似性矩阵?

给定矩阵

structure(list(X1 = c(1L, 2L, 3L, 4L, 2L, 5L), X2 = c(2L, 3L, 
4L, 5L, 3L, 6L), X3 = c(3L, 4L, 4L, 5L, 3L, 2L), X4 = c(2L, 4L, 
6L, 5L, 3L, 8L), X5 = c(1L, 3L, 2L, 4L, 6L, 4L)), .Names = c("X1", 
"X2", "X3", "X4", "X5"), class = "data.frame", row.names = c(NA, 
-6L))
Run Code Online (Sandbox Code Playgroud)

我想创建一个5 x 5距离矩阵,其中匹配比率和所有列之间的总行数.例如,X4和X3之间的距离应为0.5,假设两列匹配6次中的3次.

我尝试使用dist(test, method="simple matching")包"代理",但此方法仅适用于二进制数据.

r distance similarity metric matching

1
推荐指数
1
解决办法
1466
查看次数

如何用php检测文本的相似比?

假设我有两句话:

"敏捷的棕色狐狸跳过了懒狗"

"快速的棕色兔子跳过懒猫"

有没有算法来检测这两个句子的相似比?例如:

function similarity_ratio($text1, $text2) {
code code code
return $similarity_ratio;
}
$text1 = "The quick brown fox jumps over the lazy dog";
$text2 = "The quick brown cat jumps over the lazy chicken";
echo similarity_ratio($text1, $text2);
// output 88%
Run Code Online (Sandbox Code Playgroud)

php similarity

1
推荐指数
1
解决办法
1308
查看次数

BM25在Lucene 4.9

我正在努力与Lucene的BM25Similarity类(链接).Web上提供的所有示例都涉及较早的实现(链接).我恳请一个指针如何修改下面的标准玩具示例,以包括BM25相似性(创建索引和执行搜索).

import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StringField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopScoreDocCollector;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;

import java.io.IOException;

public class HelloLucene {
  public static void main(String[] args) throws IOException, ParseException {
    // Specify the analyzer for tokenizing text.
    // The same analyzer should be used for indexing and searching
    StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_4_9);

    // …
Run Code Online (Sandbox Code Playgroud)

lucene similarity

1
推荐指数
1
解决办法
2315
查看次数

Matlab计算三维相似变换.fitgeotrans for 3D

如何计算3D中4点之间的MatLab相似度变换?我可以从中计算变换矩阵

T*X = Xp,

但由于点坐标误差很小,它会给我仿射矩阵.我怎样才能将该矩阵与相似矩阵相匹配?我需要类似的东西fitgeotrans,但需要3D

谢谢

matlab transformation similarity affinetransform rotational-matrices

1
推荐指数
1
解决办法
3775
查看次数

在Java或ImageMagick中测量两个图像的相似度

我有两种不同的算法,它们将图像作为输入.图像具有不同颜色的多边形.该算法"简化"了这些多边形(使它们具有较少的角和边)并去除了太小的多边形.

这两种算法的工作方式不同,我想知道哪一种更接近原始图像哪一种更好.我遇到过这个,但这并不是我想要的.

这两个图像

图片1 , 图片2

应该具有50%的相似性,但根据该算法,它们的相似性为80%.

我还找到了一个名为ImageMagick的工具,可以比较两个图像.但我不确定输出的含义是什么以及如何使用它们来解决我的问题.

java png compare imagemagick similarity

1
推荐指数
1
解决办法
3093
查看次数

比较两个字符串与PHP之间的相似性

嘿伙计:)我想问一些解决方案.现在,我有字典words.txt,这里有一些例子:

happy
laugh
sad
Run Code Online (Sandbox Code Playgroud)

我有俚语字符串:

hppy
Run Code Online (Sandbox Code Playgroud)

我想搜索并匹配那个俚语字符串到我的字典,这意味着它会返回"happy",因为那些字符串在字典中引用"happy".

最近我一直在使用similar_text(),但对其有效性没有信心.你们能为我的问题推荐更好的解决方案吗?谢谢 :)

在这里我把我的代码:

function searchwords($tweet){
//echo $tweet;
$find       = false;
$handle     = @fopen("words.txt", "r");
if ($handle)
{
    while (!feof($handle))
    {
        $buffer         = fgets($handle);
        similar_text(trim($tweet),trim($buffer),$percent);
        if ($percent == 100){ // this exact match
            $find = true;
        }else if ($percent >= 90){ //there is the possibility of errors
            $find = true;
        }

    }
    fclose($handle);
}
  if ($find == true){
    unset($tweet); …
Run Code Online (Sandbox Code Playgroud)

php similarity

1
推荐指数
1
解决办法
5728
查看次数