小编Man*_*men的帖子

groupby.apply(..)后Pandas drop group列

        uid  iid  val
uid                 
1   1    1    5   5.5
2   3    1    4   3.5
2   2    1    4   3.5
2   7    1    4   3.5
2   9    1    4   3.5
2   11   1    4   3.5
Run Code Online (Sandbox Code Playgroud)

从上面的数据框中,我想删除第一列,即:

uid
1
2
2
2
2
2
Run Code Online (Sandbox Code Playgroud)

并提取

    uid  iid  val

1    1    5   5.5
3    1    4   3.5
2    1    4   3.5
7    1    4   3.5
9    1    4   3.5
11   1    4   3.5
Run Code Online (Sandbox Code Playgroud)

有人可以帮忙吗?

python group-by dataframe pandas pandas-groupby

6
推荐指数
2
解决办法
5271
查看次数

Pandas - 按ID分组并删除重复阈值

我有以下数据:

userid itemid
  1       1
  1       1
  1       3
  1       4
  2       1
  2       2
  2       3
Run Code Online (Sandbox Code Playgroud)

我想删除已查看相同itemID大于或等于两次的userID.例如,userid = 1已经两次查看itemid = 1,因此我想删除userid = 1的整个记录​​.但是,由于userid = 2没有两次查看同一项,我将保留userid = 2.

所以我希望我的数据如下:

userid itemid
  2       1
  2       2
  2       3
Run Code Online (Sandbox Code Playgroud)

有人能帮我吗?

import pandas as pd    
df = pd.DataFrame({'userid':[1,1,1,1, 2,2,2],
                   'itemid':[1,1,3,4, 1,2,3] })
Run Code Online (Sandbox Code Playgroud)

python group-by duplicates threshold pandas

5
推荐指数
2
解决办法
5590
查看次数

用于在某些两个字符串之间提取字符串的python正则表达式

我们假设我有一个字符串

st = "'aaa': '1', 'bbb': '2.3', 'ccc': 'name'"
Run Code Online (Sandbox Code Playgroud)

我想从以下提取

['1', '2.3', 'name']
Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点?

谢谢

python regex

3
推荐指数
1
解决办法
36
查看次数

python - 填写关于pandas中特定属性的缺失日期

我的数据如下所示:

id, date, target
1,2016-10-24,22
1,2016-10-25,31
1,2016-10-27,44
1,2016-10-28,12
2,2016-10-21,22
2,2016-10-22,31
2,2016-10-25,44
2,2016-10-27,12
Run Code Online (Sandbox Code Playgroud)

我想在id中填写缺少的日期.例如,id = 1的日期范围是2016-10-24~2016-10-28,缺少2016-10-26.此外,id = 2的日期范围是2016-10-21~2016-10-27,2016-10-23,2016-10-24和2016-10-26都不见了.我想填写缺少的日期并将目标值填写为0.

因此,我希望我的数据如下:

id, date, target
1,2016-10-24,22
1,2016-10-25,31
1,2016-10-26,0
1,2016-10-27,44
1,2016-10-28,12
2,2016-10-21,22
2,2016-10-22,31
2,2016-10-23,0
2,2016-10-24,0
2,2016-10-25,44
2,2016-10-26,0
2,2016-10-27,12
Run Code Online (Sandbox Code Playgroud)

有人能帮助我吗?

提前致谢.

python pandas

2
推荐指数
1
解决办法
851
查看次数