小编leo*_*fer的帖子

如何计算不同熊猫列中两个日期之间的年数

一列有日期，而另一列有一个包含日期的字符串，所以我首先需要从该字符串中提取日期部分。

import pandas as pd
import datetime
from dateutil.relativedelta import relativedelta

# the dataframe - id column always starts with year, month and day
df = pd.DataFrame({'id': ['19520630F8', '19680321A5', '19711113E2'],
                   'dte': ['2010-06-02', '2007-08-12', '2013-01-23']})

# create a date string from df['id'] to the format yyyy-mm-dd
dob = (df['id'].str[:4] + '-' +
       df['id'].str[4:6] + '-' +
       df['id'].str[6:8])

# calculate age (years only) at df['dte']
df['age'] = relativedelta(date, dob).years

Run Code Online (Sandbox Code Playgroud)

我收到错误消息：

ValueError：系列的真值不明确。使用 a.empty、a.bool()、a.item()、a.any() 或 a.all()。

我不明白我的数据的歧义，以及在哪里应用那些空/布尔/项目......df['dta']对象数据类型而不是日期时间的列if，但将dob的创建包装在pd.to_datetime无济于事。

编辑预期的输出应该是

          dte          id …

Run Code Online (Sandbox Code Playgroud)

python datetime dataframe pandas

leo*_*fer

2018 06-12

4
推荐指数

2
解决办法

5027
查看次数

修改 pandas 数据框列的字符串值

在数据框中

\n\n

df = pd.DataFrame({'c1': ['c10:b', 'c11', 'c12:k'], 'c2': ['c20', 'c21', 'c22']})\n\n     c1    c2\n0   c10:b  c20\n1   c11    c21\n2   c12:k  c22\n

Run Code Online (Sandbox Code Playgroud)\n\n

我想修改 c1 列的字符串值，以便删除冒号之后（包括）的所有内容，因此最终结果如下：

\n\n

     c1    c2\n0   c10    c20\n1   c11    c21\n2   c12    c22\n

Run Code Online (Sandbox Code Playgroud)\n\n

我试过切片

\n\n

df[\xe2\x80\x99c1\xe2\x80\x99].str[:df[\xe2\x80\x99c1\xe2\x80\x99].str.find(\xe2\x80\x99:\xe2\x80\x99)]\n

Run Code Online (Sandbox Code Playgroud)\n\n

但它不起作用。我该如何实现这个目标？

python dataframe pandas

leo*_*fer

lucky-day

3
推荐指数

1
解决办法

6516
查看次数

标签统计

dataframe ×2

pandas ×2

python ×2

datetime ×1

如何计算不同熊猫列中两个日期之间的年数

修改 pandas 数据框列的字符串值

标签 统计

小编leo_fer的帖子

标签统计