我有以下查询:
SELECT mutations.id, genes.loc FROM mutations, genes where mutations.id=genes.id;
Run Code Online (Sandbox Code Playgroud)
并输出:
| SL2.50ch02_51014904 | intergenic |
| SL2.50ch02_51014907 | upstream |
| SL2.50ch02_51014907 | downstream |
| SL2.50ch02_51014907 | intergenic |
| SL2.50ch02_51014911 | upstream |
| SL2.50ch02_51014911 | downstream |
Run Code Online (Sandbox Code Playgroud)
我想要的输出是这样的:
| SL2.50ch02_51014904 | intergenic |
| SL2.50ch02_51014907 | upstream,downstream,intergenic |
| SL2.50ch02_51014911 | upstream,downstream |
Run Code Online (Sandbox Code Playgroud)
我认为GROUP_CONCAT对此很有用.但是,这样做:
SELECT mutations.id, GROUP_CONCAT(distinct(genes.loc)) FROM mutations, genes WHERE mutations.id=genes.id;
Run Code Online (Sandbox Code Playgroud)
我有一个像这样的独特行:
SL2.50ch02_51014904 | downstream,intergenic,upstream
Run Code Online (Sandbox Code Playgroud)
我怎么解决这个问题?
你需要添加group by:
SELECT m.id, GROUP_CONCAT(distinct(g.loc))
FROM mutations m JOIN
genes g
ON m.id = g.id
GROUP BY m.id;
Run Code Online (Sandbox Code Playgroud)
在此过程中,您应该学习其他一些东西:
join语法.一个简单的规则:从不在from子句中使用逗号.m和g).它们使查询更容易编写和阅读.