如何将Period字符串转换为实际的Period类型

ale*_*dev 2 python dataframe pandas

我有一列数据,如'1971q1','1972q2'等等(年份跟随季度)当我这样做时:

print(type(df.Quarterly))
Run Code Online (Sandbox Code Playgroud)

答案是 Series

我需要的是"转换"/将此列转换为真正的pd.Period类型,以便我可以用它做简单的时间代数.谢谢

Max*_*axU 5

你可以使用pd.PeriodIndex()方法.

假设您有以下DF:

In [517]: x
Out[517]:
  str_col
0  1971q1
1  1971q2
2  1971q3
3  1971q4
4  1972q1
5  1972q2
6  1972q3
7  1972q4

In [518]: x.dtypes
Out[518]:
str_col    object
dtype: object
Run Code Online (Sandbox Code Playgroud)

让我们创建一个新的"期间"列:

In [519]: x['period'] = pd.PeriodIndex(x.str_col, freq='Q')

In [520]: x
Out[520]:
  str_col period
0  1971q1 1971Q1
1  1971q2 1971Q2
2  1971q3 1971Q3
3  1971q4 1971Q4
4  1972q1 1972Q1
5  1972q2 1972Q2
6  1972q3 1972Q3
7  1972q4 1972Q4

In [521]: x.dtypes
Out[521]:
str_col    object
period     object
dtype: object
Run Code Online (Sandbox Code Playgroud)

现在我们可以做"时间代数",比如让我们减去每个时期的四分之一:

In [525]: x.period - 1
Out[525]:
0   1970Q4
1   1971Q1
2   1971Q2
3   1971Q3
4   1971Q4
5   1972Q1
6   1972Q2
7   1972Q3
Name: period, dtype: object
Run Code Online (Sandbox Code Playgroud)

或者,您可以将str_col列强制转换为常规Pandas/NumPy datetime:

In [527]: pd.to_datetime(x.str_col, errors='coerce')
Out[527]:
0   1971-01-01
1   1971-04-01
2   1971-07-01
3   1971-10-01
4   1972-01-01
5   1972-04-01
6   1972-07-01
7   1972-10-01
Name: str_col, dtype: datetime64[ns]
Run Code Online (Sandbox Code Playgroud)