uid iid val
uid
1 1 1 5 5.5
2 3 1 4 3.5
2 2 1 4 3.5
2 7 1 4 3.5
2 9 1 4 3.5
2 11 1 4 3.5
Run Code Online (Sandbox Code Playgroud)
从上面的数据框中,我想删除第一列,即:
uid
1
2
2
2
2
2
Run Code Online (Sandbox Code Playgroud)
并提取
uid iid val
1 1 5 5.5
3 1 4 3.5
2 1 4 3.5
7 1 4 3.5
9 1 4 3.5
11 1 4 3.5
Run Code Online (Sandbox Code Playgroud)
有人可以帮忙吗?
我有以下数据:
userid itemid
1 1
1 1
1 3
1 4
2 1
2 2
2 3
Run Code Online (Sandbox Code Playgroud)
我想删除已查看相同itemID大于或等于两次的userID.例如,userid = 1已经两次查看itemid = 1,因此我想删除userid = 1的整个记录.但是,由于userid = 2没有两次查看同一项,我将保留userid = 2.
所以我希望我的数据如下:
userid itemid
2 1
2 2
2 3
Run Code Online (Sandbox Code Playgroud)
有人能帮我吗?
import pandas as pd
df = pd.DataFrame({'userid':[1,1,1,1, 2,2,2],
'itemid':[1,1,3,4, 1,2,3] })
Run Code Online (Sandbox Code Playgroud) 我们假设我有一个字符串
st = "'aaa': '1', 'bbb': '2.3', 'ccc': 'name'"
Run Code Online (Sandbox Code Playgroud)
我想从以下提取
['1', '2.3', 'name']
Run Code Online (Sandbox Code Playgroud)
我怎样才能做到这一点?
谢谢
我的数据如下所示:
id, date, target
1,2016-10-24,22
1,2016-10-25,31
1,2016-10-27,44
1,2016-10-28,12
2,2016-10-21,22
2,2016-10-22,31
2,2016-10-25,44
2,2016-10-27,12
Run Code Online (Sandbox Code Playgroud)
我想在id中填写缺少的日期.例如,id = 1的日期范围是2016-10-24~2016-10-28,缺少2016-10-26.此外,id = 2的日期范围是2016-10-21~2016-10-27,2016-10-23,2016-10-24和2016-10-26都不见了.我想填写缺少的日期并将目标值填写为0.
因此,我希望我的数据如下:
id, date, target
1,2016-10-24,22
1,2016-10-25,31
1,2016-10-26,0
1,2016-10-27,44
1,2016-10-28,12
2,2016-10-21,22
2,2016-10-22,31
2,2016-10-23,0
2,2016-10-24,0
2,2016-10-25,44
2,2016-10-26,0
2,2016-10-27,12
Run Code Online (Sandbox Code Playgroud)
有人能帮助我吗?
提前致谢.