我想计算两个单词列表之间的相似度,例如:
['email','user','this','email','address','customer']
类似于这个列表:
['email','mail','address','netmail']
我希望比另一个列表具有更高的相似度百分比,例如:
['address','ip','network']即使address存在于列表中。
我有两个相同大小的 rgb 图像,我想计算一个相似性度量。我想从欧几里得距离开始:
import scipy.spatial.distance as dist
import cv2
im1 = cv2.imread("im1.jpg")
im2 = cv2.imread("im2.jpg")
>> im1.shape
(820, 740, 3)
>> dist.euclidean(im1,im2)
ValueError: Input vector should be 1-D.
Run Code Online (Sandbox Code Playgroud)
我知道dist.euclidean需要一个1-d阵列和im1和im2是3-d,但有将与3-d阵列工作,或者是否有可能变换函数im1和im2到1-d阵列蜜饯在图像中的信息?
我有一些带有一些文件名(LIST1)的泛型和另一个带有完整名称列表的大型通用(LIST2).我需要将LIST1中的名称与LIST2中的类似名称相匹配.例如
LIST1
- **MAIZE_SLIP_QUANTITY_3_9.1.aif**
LIST 2
1- TUTORIAL_FAILURE_CLINCH_4.1.aif
2- **MAIZE_SLIP_QUANTITY_3_5.1.aif**
3- **MAIZE_SLIP_QUANTITY_3_9.2.aif**
4- TUTORIAL_FAILURE_CLINCH_5.1.aif
5- TUTORIAL_FAILURE_CLINCH_6.1.aif
6- TUTORIAL_FAILURE_CLINCH_7.1.aif
7- TUTORIAL_FAILURE_CLINCH_8.1.aif
8- TUTORIAL_FAILURE_CLINCH_9.1.aif
9- TUTORIAL_FAILURE_PUSH_4.1.aif
Run Code Online (Sandbox Code Playgroud)
我已经阅读了Levenshtein距离并在框架(SignumFramework Utilities)中使用了它的实现. 它在第2行和第3行返回距离= 1.但在我的情况下,第3行比第2行更好.
还有另一种方法可以比较相似的字符串吗?更灵活的东西?
我正在研究用Java检测2个视频之间的相似性.用户将建议两个视频,软件必须通过检查文件内容来检测它们是否相似.我读到可以比较2个视频的每个帧.任何人都可以分享可以用Java实现的任何合适的算法(或代码或方法)吗?
给定矩阵
structure(list(X1 = c(1L, 2L, 3L, 4L, 2L, 5L), X2 = c(2L, 3L,
4L, 5L, 3L, 6L), X3 = c(3L, 4L, 4L, 5L, 3L, 2L), X4 = c(2L, 4L,
6L, 5L, 3L, 8L), X5 = c(1L, 3L, 2L, 4L, 6L, 4L)), .Names = c("X1",
"X2", "X3", "X4", "X5"), class = "data.frame", row.names = c(NA,
-6L))
Run Code Online (Sandbox Code Playgroud)
我想创建一个5 x 5距离矩阵,其中匹配比率和所有列之间的总行数.例如,X4和X3之间的距离应为0.5,假设两列匹配6次中的3次.
我尝试使用dist(test, method="simple matching")包"代理",但此方法仅适用于二进制数据.
假设我有两句话:
"敏捷的棕色狐狸跳过了懒狗"
"快速的棕色兔子跳过懒猫"
有没有算法来检测这两个句子的相似比?例如:
function similarity_ratio($text1, $text2) {
code code code
return $similarity_ratio;
}
$text1 = "The quick brown fox jumps over the lazy dog";
$text2 = "The quick brown cat jumps over the lazy chicken";
echo similarity_ratio($text1, $text2);
// output 88%
Run Code Online (Sandbox Code Playgroud) 我正在努力与Lucene的BM25Similarity类(链接).Web上提供的所有示例都涉及较早的实现(链接).我恳请一个指针如何修改下面的标准玩具示例,以包括BM25相似性(创建索引和执行搜索).
import org.apache.lucene.analysis.standard.StandardAnalyzer;
import org.apache.lucene.document.Document;
import org.apache.lucene.document.Field;
import org.apache.lucene.document.StringField;
import org.apache.lucene.document.TextField;
import org.apache.lucene.index.DirectoryReader;
import org.apache.lucene.index.IndexReader;
import org.apache.lucene.index.IndexWriter;
import org.apache.lucene.index.IndexWriterConfig;
import org.apache.lucene.queryparser.classic.ParseException;
import org.apache.lucene.queryparser.classic.QueryParser;
import org.apache.lucene.search.IndexSearcher;
import org.apache.lucene.search.Query;
import org.apache.lucene.search.ScoreDoc;
import org.apache.lucene.search.TopScoreDocCollector;
import org.apache.lucene.store.Directory;
import org.apache.lucene.store.RAMDirectory;
import org.apache.lucene.util.Version;
import java.io.IOException;
public class HelloLucene {
public static void main(String[] args) throws IOException, ParseException {
// Specify the analyzer for tokenizing text.
// The same analyzer should be used for indexing and searching
StandardAnalyzer analyzer = new StandardAnalyzer(Version.LUCENE_4_9);
// …Run Code Online (Sandbox Code Playgroud) 如何计算3D中4点之间的MatLab相似度变换?我可以从中计算变换矩阵
T*X = Xp,
但由于点坐标误差很小,它会给我仿射矩阵.我怎样才能将该矩阵与相似矩阵相匹配?我需要类似的东西fitgeotrans,但需要3D
谢谢
matlab transformation similarity affinetransform rotational-matrices
我有两种不同的算法,它们将图像作为输入.图像具有不同颜色的多边形.该算法"简化"了这些多边形(使它们具有较少的角和边)并去除了太小的多边形.
这两种算法的工作方式不同,我想知道哪一种更接近原始图像哪一种更好.我遇到过这个,但这并不是我想要的.
这两个图像
,
应该具有50%的相似性,但根据该算法,它们的相似性为80%.
我还找到了一个名为ImageMagick的工具,可以比较两个图像.但我不确定输出的含义是什么以及如何使用它们来解决我的问题.
嘿伙计:)我想问一些解决方案.现在,我有字典words.txt,这里有一些例子:
happy
laugh
sad
Run Code Online (Sandbox Code Playgroud)
我有俚语字符串:
hppy
Run Code Online (Sandbox Code Playgroud)
我想搜索并匹配那个俚语字符串到我的字典,这意味着它会返回"happy",因为那些字符串在字典中引用"happy".
最近我一直在使用similar_text(),但对其有效性没有信心.你们能为我的问题推荐更好的解决方案吗?谢谢 :)
在这里我把我的代码:
function searchwords($tweet){
//echo $tweet;
$find = false;
$handle = @fopen("words.txt", "r");
if ($handle)
{
while (!feof($handle))
{
$buffer = fgets($handle);
similar_text(trim($tweet),trim($buffer),$percent);
if ($percent == 100){ // this exact match
$find = true;
}else if ($percent >= 90){ //there is the possibility of errors
$find = true;
}
}
fclose($handle);
}
if ($find == true){
unset($tweet); …Run Code Online (Sandbox Code Playgroud) similarity ×10
compare ×2
java ×2
php ×2
python ×2
c# ×1
data-mining ×1
detection ×1
distance ×1
imagemagick ×1
lucene ×1
matching ×1
matlab ×1
metric ×1
png ×1
r ×1
string ×1
text-mining ×1
video ×1