Python - 数据框的维度

use*_*092 69 python pandas

Python新手.

在R中,您可以使用dim(...)获取矩阵的维数.Python Pandas的数据框中的相应功能是什么?

Bre*_*arn 125

df.shape,df你的DataFrame 在哪里.


Ted*_*rou 20

获取有关DataFrame或Series维度信息的所有方法的摘要

有许多方法可以获取有关DataFrame或Series属性的信息.

创建示例DataFrame和Series

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64
Run Code Online (Sandbox Code Playgroud)

shape 属性

shape属性返回DataFrame中行数和列数的两项元组.对于Series,它返回一个项目元组.

df.shape
(3, 2)

s.shape
(3,)
Run Code Online (Sandbox Code Playgroud)

len 功能

要获取DataFrame的行数或获取Series的长度,请使用该len函数.将返回一个整数.

len(df)
3

len(s)
3
Run Code Online (Sandbox Code Playgroud)

size 属性

要获取DataFrame或Series中的元素总数,请使用该size属性.对于DataFrame,这是行数和列数的乘积.对于系列,这将等同于len功能:

df.size
6

s.size
3
Run Code Online (Sandbox Code Playgroud)

ndim 属性

ndim属性返回DataFrame或Series的维度数.DataFrames总是2,系列1:

df.ndim
2

s.ndim
1
Run Code Online (Sandbox Code Playgroud)

棘手的count方法

count方法可用于返回DataFrame的每个列/行的非缺失值的数量.这可能非常令人困惑,因为大多数人通常认为计数只是每行的长度,而不是.在DataFrame上调用时,将返回Series,其中索引中的列名称和非缺失值的数量作为值.

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64


df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64
Run Code Online (Sandbox Code Playgroud)

对于Series,只有一个轴用于计算,因此它只返回一个标量:

s.count()
2
Run Code Online (Sandbox Code Playgroud)

使用该info方法检索元数据

info方法返回每列的非缺失值和数据类型的数量

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
Run Code Online (Sandbox Code Playgroud)