小编Ear*_*ker的帖子

在sql中选择具有最新日期的行,每个ID重复多次

我有一个表,每个ID重复3次.每行中每个id前面都有一个日期.
我想为最新日期的每个ID选择整行.此表中共有370列我希望在选择该行时选择所有列.

样品 -

ID   Name    Date        Marks    ..    ..  ..   
1     XY     4/3/2017     27
1     fv     4/3/2014     98
1     jk     4/3/2016     09
2     RF     4/12/2015    87
2     kk     4/3/2009     56
2     PP     4/3/2011     76
3     ee     4/3/2001     12
3     ppp    4/3/2003     09
3     lll    4/3/2011     23
Run Code Online (Sandbox Code Playgroud)

答案应该是

ID   Name    Date        Marks    ..    ..  ..   
1     XY     4/3/2017     27      
2     RF     4/12/2015    87
3     lll    4/3/2011     23  
Run Code Online (Sandbox Code Playgroud)

我正在尝试如下 -

select distinct ID,*,max(date) as maxdate from table
Run Code Online (Sandbox Code Playgroud)

我也是在Hive中尝试这个.所以不确定某些sql函数是否在Hive中不起作用

谢谢

mysql sql hive

6
推荐指数
4
解决办法
6万
查看次数

用 id 替换另一个数据帧中的 NA 值

我有一个数据框 df1 如下 -

ID Count 
11  345
22  456
33  786
44  765
55  NA
66  888
77  NA
Run Code Online (Sandbox Code Playgroud)

然后我有一个 df2 如下 -

 ID  Count 
 11  536
 22  654
 33  786
 44  999
 55  890
 66  111
 77  654
Run Code Online (Sandbox Code Playgroud)

我希望将NAin 中的值df1替换为df2这些特定 id 中的值。

结果df3应该是:

ID  Count 
11  345
22  456
33  786
44  765
55  890
66  888
77  654
Run Code Online (Sandbox Code Playgroud)

任何帮助都会非常感谢

r dataframe

6
推荐指数
2
解决办法
5524
查看次数

标签 统计

dataframe ×1

hive ×1

mysql ×1

r ×1

sql ×1