我有两个数据框,df1包含参考数据和df2新数据。对于 中的每一行,我需要根据汉明距离df2找到最佳(和第二最佳)匹配行。df1
我使用e1071包来计算汉明距离。两个向量之间的汉明距离x可以y计算如下:
x <- c(356739, 324074, 904133, 1025460, 433677, 110525, 576942, 526518, 299386,
92497, 977385, 27563, 429551, 307757, 267970, 181157, 3796, 679012, 711274,
24197, 610187, 402471, 157122, 866381, 582868, 878)
y <- c(356739, 324042, 904133, 959893, 433677, 110269, 576942, 2230, 267130,
92496, 960747, 28587, 429551, 438825, 267970, 181157, 36564, 677220,
711274, 24485, 610187, 404519, 157122, 866413, 718036, 876)
xm <- sapply(x, intToBits)
ym <- sapply(y, intToBits) …Run Code Online (Sandbox Code Playgroud)