我有一个表,每个ID重复3次.每行中每个id前面都有一个日期.
我想为最新日期的每个ID选择整行.此表中共有370列我希望在选择该行时选择所有列.
样品 -
ID Name Date Marks .. .. ..
1 XY 4/3/2017 27
1 fv 4/3/2014 98
1 jk 4/3/2016 09
2 RF 4/12/2015 87
2 kk 4/3/2009 56
2 PP 4/3/2011 76
3 ee 4/3/2001 12
3 ppp 4/3/2003 09
3 lll 4/3/2011 23
Run Code Online (Sandbox Code Playgroud)
答案应该是
ID Name Date Marks .. .. ..
1 XY 4/3/2017 27
2 RF 4/12/2015 87
3 lll 4/3/2011 23
Run Code Online (Sandbox Code Playgroud)
我正在尝试如下 -
select distinct ID,*,max(date) as maxdate from table
Run Code Online (Sandbox Code Playgroud)
我也是在Hive中尝试这个.所以不确定某些sql函数是否在Hive中不起作用
谢谢
我有一个数据框 df1 如下 -
ID Count
11 345
22 456
33 786
44 765
55 NA
66 888
77 NA
Run Code Online (Sandbox Code Playgroud)
然后我有一个 df2 如下 -
ID Count
11 536
22 654
33 786
44 999
55 890
66 111
77 654
Run Code Online (Sandbox Code Playgroud)
我希望将NAin 中的值df1替换为df2这些特定 id 中的值。
结果df3应该是:
ID Count
11 345
22 456
33 786
44 765
55 890
66 888
77 654
Run Code Online (Sandbox Code Playgroud)
任何帮助都会非常感谢