我正在散列相同的值,但得到不同的结果。
这是一个简单的示例来解释我遇到的情况:
我有一个如下所示的维度表:
| 性别 | 性别_id |
|---|---|
| 男性 | 1 |
| 女性 | 0 |
性别的数据类型是 NVARCHAR(6),gender_id 是 INT
当我执行以下任何查询时,我得到相同的哈希值:
**Scenario 1:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, cast(gender_id as int))))
FROM demographic
WHERE gender = 'Male';
Run Code Online (Sandbox Code Playgroud)
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
**Scenario 2:**
SELECT
CONVERT(BINARY(20), HASHBYTES('Md5', Concat(Gender, CAST(gender_id AS NVARCHAR(1)))))
FROM demographic
WHERE gender = 'Male';
Run Code Online (Sandbox Code Playgroud)
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
在场景1中,我将gender_id转换为INT,在场景2中我将gender_id转换为NVARCHAR。在这两种情况下,哈希值是相同的。
当我执行调用维度中特定值而不是列的查询时,我的散列是不同的:
**Scenario 3:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as INT))));
Run Code Online (Sandbox Code Playgroud)
输出:'0x048A5F0EE2D2B4070CFF8A38CB6DAC7100000000'
**Scenario 4:**
SELECT CONVERT(BINARY(20), HASHBYTES('MD5', Concat('Male', CAST(1 as NVARCHAR(1)))));
Run Code Online (Sandbox Code Playgroud)
输出:'0x6B216D8BB993AA263265CCF645C282B100000000'
在场景 3 中,我像在场景 1 中一样将 1 转换为 INT。在场景 4 中,我像在场景 2 中一样将 …