我有两个数据框
sessions = DataFrame({"ID":[1,2,3,4,5],"2018-06-30":[23,34,45,67,75],"2018-07-31":[32,43,45,76,57]})
leads = DataFrame({"ID":[1,2,3,4,5],"2018-06-30":[7,10,28,15,30],"2018-07-31":[7,10,28,15,30]})
Run Code Online (Sandbox Code Playgroud)
我想合并 ID 上的两个数据帧,然后创建一个多索引,如下所示:
我该怎么做?
直接 pandas.merge 将创建我不想要的 suffixes_x, _y 。
我想扩展这里提出的问题
上述问题中的解决方案返回 True 或 False。布尔值可用于对正确值进行子集化。
但是,我想获取与子字符串匹配的搜索值。
例如,(借用上面的问题)
s = pd.Series(['cat','hat','dog','fog','pet'])
searchfor = ['og', 'at']
Run Code Online (Sandbox Code Playgroud)
我想知道 'cat' 与 'at' 匹配,dog 与 'og' 匹配
我正在尝试使用此答案中建议的列表将一列归入自定义类别-
bins = [0, 1, 5, 10, 25, 50, 100]
df = DataFrame({'Numbers':[0,1,2,7,11,16,45,200]})
df['Bins'] = pandas.cut(df['Numbers'], bins)
df
Numbers Bins
0 0 NaN
1 1 (0, 1]
2 2 (1, 5]
3 7 (5, 10]
4 11 (10, 25]
5 16 (10, 25]
6 45 (25, 50]
7 200 NaN
Run Code Online (Sandbox Code Playgroud)
我怎样才能装箱:
0 作为 [0,1] 和 200 作为 (100,...) 或 >100 类别?