Mysql汉明距离的十六进制值

125*_*ura 16 php mysql hash hamming-distance

我有一些存储在mysql中的哈希值,我将通过汉明距离进行比较.

存储的哈希值如下:

qw 1 ffe71b001820a1fd 
qw 2 ffffb81c1c3838a0 
qw 3 fff8381c1c3e3828 
qw 4 fffa181c3c2e3920 
qw 5 fffa981c1c3e2820 
qw 6 ff5f1c38387c1c04 
qw 7 fff1e0c1c38387ef 
qw 8 fffa181c1c3e3820 
qw 9 fffa381c1c3e3828
Run Code Online (Sandbox Code Playgroud)

我通常会像:

SELECT product_id, HAMMING_DISTANCE(phash, 'phashfromuserinput') ;
Run Code Online (Sandbox Code Playgroud)

但是在mysql汉明距离是按位运算符,如果字符串只是数字,我可以这样做:

SELECT pagedata,BIT_COUNT(pagecontent^'$encrypted')searchengine WHERE pagecontent > 2 ; ")
Run Code Online (Sandbox Code Playgroud)

它仅适用于整数(数字),但我的要求是使用数字和字母,例如:

74898fababfbef46 and 95efabfeba752545
Run Code Online (Sandbox Code Playgroud)

从我的小研究中我知道,首先我必须将字段转换为binary然后使用或bitcount使用:CASTCONVERT

SELECT BIT_COUNT( CONV( hash, 2, 10 ) ^ 
0b0000000101100111111100011110000011100000111100011011111110011011 )
Run Code Online (Sandbox Code Playgroud)

要么

SELECT BIT_COUNT(CAST(hash AS BINARY)) FROM data;
Run Code Online (Sandbox Code Playgroud)

这可以将数据转换为binary和使用bitcount.现在问题出现了该varbinary存储在字符/哈希值mysql已经是字母数字,如果我转换领域varbinarybitcount那么它将无法正常工作,存储哈希值是不是二进制字符串.

我该怎么办?

我正在推荐为php汉明距离匹配示例:

function HammingDistance($bin1, $bin2) {
    $a1 = str_split($bin1);
    $a2 = str_split($bin2);
    $dh = 0;
    for ($i = 0; $i < count($a1); $i++) 
        if($a1[$i] != $a2[$i]) $dh++;
    return $dh;
}

echo HammingDistance('10101010','01010101'); //returns 8
Run Code Online (Sandbox Code Playgroud)

但我不明白如何匹配mysql和fetch,因为我无法在mysql中实现它.

Ric*_*mes 7

以最后两个数字为例:

SELECT BIT_COUNT( CAST(CONV('fffa181c1c3e3820', 16, 10) AS UNSIGNED) ^
                  CAST(CONV('fffa381c1c3e3828', 16, 10) AS UNSIGNED) ) ;
--> 2
Run Code Online (Sandbox Code Playgroud)
  • 哈希是十六进制的.
  • 转换需要最终结束BIGINT UNSIGNED.

(如果您有MD5(128位)或SHA1(160位)哈希值,我们将不得不通过它们分割它们SUBSTR(),Xor每对,BIT_COUNT,然后添加结果.)

编辑以使用列名称:

SELECT BIT_COUNT( CAST(CONV( a.pagecontent , 16, 10) AS UNSIGNED) ^
                  CAST(CONV( b.pagecontent , 16, 10) AS UNSIGNED) ) ;
Run Code Online (Sandbox Code Playgroud)