Ted*_*rou 20
有许多方法可以获取有关DataFrame或Series属性的信息.
创建示例DataFrame和Series
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
Run Code Online (Sandbox Code Playgroud)
shape 属性该shape属性返回DataFrame中行数和列数的两项元组.对于Series,它返回一个项目元组.
df.shape
(3, 2)
s.shape
(3,)
Run Code Online (Sandbox Code Playgroud)
len 功能要获取DataFrame的行数或获取Series的长度,请使用该len函数.将返回一个整数.
len(df)
3
len(s)
3
Run Code Online (Sandbox Code Playgroud)
size 属性要获取DataFrame或Series中的元素总数,请使用该size属性.对于DataFrame,这是行数和列数的乘积.对于系列,这将等同于len功能:
df.size
6
s.size
3
Run Code Online (Sandbox Code Playgroud)
ndim 属性该ndim属性返回DataFrame或Series的维度数.DataFrames总是2,系列1:
df.ndim
2
s.ndim
1
Run Code Online (Sandbox Code Playgroud)
count方法该count方法可用于返回DataFrame的每个列/行的非缺失值的数量.这可能非常令人困惑,因为大多数人通常认为计数只是每行的长度,而不是.在DataFrame上调用时,将返回Series,其中索引中的列名称和非缺失值的数量作为值.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
Run Code Online (Sandbox Code Playgroud)
对于Series,只有一个轴用于计算,因此它只返回一个标量:
s.count()
2
Run Code Online (Sandbox Code Playgroud)
info方法检索元数据该info方法返回每列的非缺失值和数据类型的数量
df.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
Run Code Online (Sandbox Code Playgroud)