小编Cin*_*hio的帖子

MySQL 中的 INNER JOIN 返回同一行的多个条目

我通过 R 使用 MySQL。我正在处理同一个数据库中的两个表,我注意到一些我无法解释的奇怪现象。更具体地说,当我尝试使用外键在表之间建立连接时,结果不是应有的结果。

第一个表称为Genotype_microsatellites,第二个表称为Records_morpho。它们通过外键sample_id连接。

如果我仅使用以下命令从Genotype_microsatellites表中选择具有某些特征的记录...

Gen_msat <- dbGetQuery(mydb, 'SELECT * 
                   FROM Genotype_microsatellites
                   WHERE CIDK113a >= 0')
Run Code Online (Sandbox Code Playgroud)

...查询返回 52 个变量的 546 个观测值,这正是我所期望的。现在,我想做一个查询,为我的结果添加更多信息,特别是通过包含Records_morpho表中的数据。因此,我使用以下代码:

Gen_msat <- dbGetQuery(mydb, 'SELECT  Genotype_microsatellites.*,
                   Records_morpho.net_mass_g,
                   Records_morpho.svl_mm 
                   FROM Genotype_microsatellites
                   INNER JOIN Records_morpho ON Genotype_microsatellites.sample_id = Records_morpho.sample_id 
                   WHERE CIDK113a >= 0')
Run Code Online (Sandbox Code Playgroud)

问题是现在输出有 890 个观察值和 54 个变量!某些sample_id值(即数据框中的行或个体)多次出现,但事实不应该如此。我尝试使用 SLECT DISTINCT 解决此问题,但问题不会消失。

任何帮助将非常感激。

mysql r inner-join

1
推荐指数
1
解决办法
3632
查看次数

命令dist(x,method =“ binary”)如何计算距离矩阵?

我一直在试图解决这个问题,但没有成功。我正在处理带有二进制数据(0和1)的表。我设法使用R函数从数据估计了距离矩阵dist(x,method="binary"),但是我不确定该函数如何精确估计距离矩阵。是否使用Jaccard系数J =(M11)/(M10 + M01 + M11)?

r distance

-1
推荐指数
1
解决办法
6800
查看次数

标签 统计

r ×2

distance ×1

inner-join ×1

mysql ×1