你能告诉我什么时候使用这些矢量化方法和基本的例子吗?
我看到这map是一种Series方法,而其余的是DataFrame方法.我对此感到困惑apply和applymap方法.为什么我们有两种方法将函数应用于DataFrame?再一次,说明用法的简单例子会很棒!
我想按名字长度排序.似乎没有key参数,sort_values所以我不知道如何实现这一点.这是一个测试df:
import pandas as pd
df = pd.DataFrame({'name': ['Steve', 'Al', 'Markus', 'Greg'], 'score': [2, 4, 2, 3]})
Run Code Online (Sandbox Code Playgroud) 我有一个文本列,看起来像:
http://start.blabla.com/landing/fb603?&mkw...
Run Code Online (Sandbox Code Playgroud)
我想提取"start.blabla.com",它始终位于:
http://
Run Code Online (Sandbox Code Playgroud)
和:
/landing/
Run Code Online (Sandbox Code Playgroud)
即:
start.blabla.com
Run Code Online (Sandbox Code Playgroud)
我做:
df.col.str.extract('http://*?\/landing')
Run Code Online (Sandbox Code Playgroud)
但它不起作用.我究竟做错了什么?
我有一张桌子 df
a b c
1 x y [x]
2 x z [c,d]
3 x t [e,f,g]
Run Code Online (Sandbox Code Playgroud)
只是想知道如何使用 c 列的长度选择行
如
df.loc[len(df.c) >1]
Run Code Online (Sandbox Code Playgroud)
我知道这是不对的......什么应该是正确的?
我收到以下系列。我想计算每个国家的列表长度。
Scotland [1074957, 1074964, 1074968, 1074970, 287855, 3...
South Africa [1020029, 1031431, 1031433, 1031435, 222678, 2...
Sri Lanka [1001349, 1001351, 1001353, 1083449, 1083450, ...
United Arab Emirates [1072206, 1072207, 1072208, 1074962, 1074965, ...
West Indies [1041615, 1041617, 1050217, 1050219, 1050221, ...
Zimbabwe [1007655, 1007657, 1007659, 287856, 287858, 41...
Name: Id, dtype: object
Run Code Online (Sandbox Code Playgroud)
这样得到的系列 OR Dataframe 将是
Scotland 35
South Africa 57
Sri Lanka 12
United Arab Emirates 31
West Indies 74
Zimbabwe 9
Run Code Online (Sandbox Code Playgroud)
在 Pandas 中,我们如何以 Pythonic 方式做到这一点?