小编use*_*975的帖子

设置pandas中现有数据框的多索引

我有一个DataFrame看起来像

  Emp1    Empl2           date       Company
0    0        0     2012-05-01         apple
1    0        1     2012-05-29         apple
2    0        1     2013-05-02         apple
3    0        1     2013-11-22         apple
18   1        0     2011-09-09        google
19   1        0     2012-02-02        google
20   1        0     2012-11-26        google
21   1        0     2013-05-11        google
Run Code Online (Sandbox Code Playgroud)

我想通过公司和日期设置MultiIndex为这个DataFrame.目前它有一个默认索引.我在用df.set_index(['Company', 'date'], inplace=True)

df = pd.DataFrame()
for c in company_list:
        row = pd.DataFrame([dict(company = '%s' %s, date = datetime.date(2012, 05, 01))])
        df = df.append(row, ignore_index = True)
        for …
Run Code Online (Sandbox Code Playgroud)

python pandas

34
推荐指数
1
解决办法
5万
查看次数

摆脱pandas数据帧中的NaT值

我有一个如下所示的数据框

                               mean
comp_name  date                      
Appdynamics 2012-05-01 00:18:15.910000
            2012-05-01             NaT
            2012-05-01             NaT
            2012-05-02 00:20:12.145200
            2012-05-02             NaT
            2012-05-02             NaT
Run Code Online (Sandbox Code Playgroud)

这里comp_name和date形成multiindex.我想摆脱NaT值,只获得那些平均值(timedelta64)不是NaT的行.

                               mean
comp_name  date                      
Appdynamics 2012-05-01 00:18:15.910000
            2012-05-02 00:20:12.145200
Run Code Online (Sandbox Code Playgroud)

有什么想法吗?

python pandas

8
推荐指数
1
解决办法
9577
查看次数

基于列合并pandas中的数据帧行

我是熊猫新手.我有一个看起来像这样的数据框

sitename            name        date               count
0  chess.com  Autobiographer  2012-05-01               2
1  chess.com  Autobiographer  2012-05-05               1
2  chess.com  Autobiographer  2012-05-15               1
3  chess.com  Autobiographer  2012-05-01               1
4  chess.com  Autobiographer  2012-05-15               1
5  chess.com  Autobiographer  2012-05-01               1
Run Code Online (Sandbox Code Playgroud)

如何根据日期合并行并总结同一日期的计数.喜欢在sql中

select sitename, name, date count(*) from table group by date
Run Code Online (Sandbox Code Playgroud)

python pandas

7
推荐指数
1
解决办法
2万
查看次数

在Pandas数据框中用NaT替换日期

我有一个带有datetime64类型列的数据框.在这一列中有几行日期为1999-09-09 23:59:59,因为它们实际上应该表示为缺少日期NaT.有人刚决定使用这个特定日期来表示缺失的数据.现在我希望将这些日期替换为NaT(Pandas的缺失日期类型).

此外,如果我使用NaTs对此列执行操作,例如

df['date'] - df['column with missing date']
Run Code Online (Sandbox Code Playgroud)

Pandas是否忽略了缺少的日期并为这些行维护NaT,或者它会在Java中抛出一些错误,例如Null指针异常.

dataframe pandas

7
推荐指数
1
解决办法
9267
查看次数

Java String.split:使用\\ W作为非单词分隔符时遇到问题

根据这里提供的建议, 我尝试使用\\ W作为java的string.split函数中非单词字符的分隔符.

String str = "id-INT, name-STRING,";
Run Code Online (Sandbox Code Playgroud)

这看起来像一个非常简单的字符串.我想从这个字符串中提取单词.我得到的数组的长度是5,而它应该是4.在INT之后的位置有一个空字符串.我不明白为什么那里的空间不被视为非单词

java regex string

2
推荐指数
1
解决办法
7743
查看次数

在 Sqlalchemy 中更新多列

我有一个在 Flask 上运行并使用 sqlalchemy 与数据库交互的应用程序。我想用用户指定的值更新表的列。我正在使用的查询是

def update_table(value1, value2, value3):
     query = update(Table).where(Table.column1 == value1).values(Table.column2 = value2, Table.column3 = value3)
Run Code Online (Sandbox Code Playgroud)

我不确定我传递值的方式是否正确。还有 Table.column2/3 i=gives error say Can't assign to function call。column2/3 不是函数,它们是字段名称。那么,如何更新多个值以及为什么会在此处出错?

PS:我参考了sqlalchemy doc

python sqlalchemy python-2.7 flask-sqlalchemy

2
推荐指数
1
解决办法
1万
查看次数