小编Ant*_*pov的帖子

为什么在pandas dataframe列中应用更改dtype

我有以下数据帧:

import pandas as pd
import numpy as np
df = pd.DataFrame(dict(A = np.arange(3), 
                         B = np.random.randn(3), 
                         C = ['foo','bar','bah'], 
                         D = pd.Timestamp('20130101')))

print(df)

   A         B    C          D
0  0 -1.087180  foo 2013-01-01
1  1 -1.343424  bar 2013-01-01
2  2 -0.193371  bah 2013-01-01

Run Code Online (Sandbox Code Playgroud)

dtypes 对于列:

print(df.dtypes)
A             int32
B           float64
C            object
D    datetime64[ns]
dtype: object

Run Code Online (Sandbox Code Playgroud)

但在使用apply它们之后所有对象的更改:

print(df.apply(lambda x: x.dtype))
A    object
B    object
C    object
D    object
dtype: object

Run Code Online (Sandbox Code Playgroud)

为什么dtypes强迫反对？我认为apply只应在列中考虑.

pandas 0.17.1
python …

python pandas

Ant*_*pov

lucky-day

5
推荐指数

1
解决办法

1263
查看次数

通过装饰器断言 pandas 数据框具有日期时间索引

如何添加一个装饰器，声明函数传入的 pandas 数据帧参数具有日期时间索引？

我查看了 engarde 和 validada 包，但还没有找到任何东西。我可以在函数内部进行此检查，但更喜欢装饰器。

python decorator pandas datetimeindex

use*_*827

2016 02-04

4
推荐指数

1
解决办法

1915
查看次数

按索引从 Pandas 系列中删除元素

我有一个熊猫系列 df（日期 = 索引）：

2015-09-10     58
2015-09-11     40
2015-09-12     33
2015-09-13     42
2015-09-14     22
2015-09-15     88
2015-09-16     99
2015-09-17    124

Run Code Online (Sandbox Code Playgroud)

我想将日期从 2015-09-11 删除到 2015-09-15，所以我的 df 看起来像：

2015-09-10     58
2015-09-16     99
2015-09-17    124

Run Code Online (Sandbox Code Playgroud)

我试过使用 df.drop["2015-09-11":"2015-09-15"]，但出现错误：

TypeError: 'instancemethod' object has no attribute '__getitem__'

Run Code Online (Sandbox Code Playgroud)

有什么建议吗？

谢谢！

python dataframe pandas

jjj*_*ayn

2015 12-03

3
推荐指数

1
解决办法

5519
查看次数

如何简化if语句是的

如果简化这个,最好的方法是什么？

#!/usr/bin/python

ans=input("choose yes or no: ")

if ans == "yes" or ans == "YES" or ans == "y" or ans == "Y":
    print("ok")
else:
        print("no")

Run Code Online (Sandbox Code Playgroud)

python

Pol*_*len

2015 12-31

3
推荐指数

1
解决办法

92
查看次数

如何将包含重复值的列表转换为以列表作为值的字典？

假设我有两个由另一个函数生成的列表:

test = [[0, 1], [0, 2], [1, 5], [1,6], [2, 0], [3, 99], [3, 89], [3, 79]]
test2 = [[1, 4], [4, 1]]

Run Code Online (Sandbox Code Playgroud)

我想将它们转换为关联数组,以便快速查找,如下所示:

test: {0: [1, 2], 1: [5,6], 2: [0], 3: [99, 98, 97]}
test2: {1: [4], 4: [1]}

Run Code Online (Sandbox Code Playgroud)

我可以这样做:

def list_to_dict(my_list):
    last_val = my_list[0][0]
    temp = []
    my_dict = {}

    for i in my_list:
        if last_val == i[0]:
            temp.append(i[1])
        else:
            #add the values to this key
            my_dict[last_val] = temp
            #reset the list
            temp = []
            temp.append(i[1]) …

Run Code Online (Sandbox Code Playgroud)

python list-comprehension

Jon*_*gro

2016 05-26

3
推荐指数

1
解决办法

38
查看次数

Python：在条形图中绘制百分比

对于数据框

import pandas as pd
df=pd.DataFrame({'group':list("AADABCBCCCD"),'Values':[1,0,1,0,1,0,0,1,0,1,0]})

Run Code Online (Sandbox Code Playgroud)

我试图绘制一个显示时间百分比A, B, C, D为零（或一个）的条形图。

我有一个可行的方法，但我认为必须有更直接的方法

tempdf=df.groupby(['group','Values']).Values.count().unstack().fillna(0)
tempdf['total']=df['group'].value_counts()
tempdf['percent']=tempdf[0]/tempdf['total']*100

tempdf.reset_index(inplace=True)
print tempdf

sns.barplot(x='group',y='percent',data=tempdf)

Run Code Online (Sandbox Code Playgroud)

如果仅绘制平均值，我可以sns.barplot在df数据框上比tempdf 做更多。如果我对绘制百分比感兴趣，我不确定如何优雅地做到这一点。

谢谢，

python bar-chart pandas seaborn

Pag*_*Max

2016 02-29

2
推荐指数

3
解决办法

2万
查看次数

Python/Pandas - DataFrame索引 - 向前移动一个月

我有一个DataFrame:

                Actual       Pred
Date                             
2005-04-01        10.2  10.364470
2005-05-01         9.4   9.542778
2005-06-01         9.5   9.684794
2005-07-01         9.4   9.547604
2005-08-01         9.7   9.768893

Run Code Online (Sandbox Code Playgroud)

我想为每个DataFrame的索引添加一个月,所以它看起来像这样:

                Actual       Pred
Date                             
2005-05-01        10.2  10.364470
2005-06-01         9.4   9.542778
2005-07-01         9.5   9.684794
2005-08-01         9.4   9.547604
2005-09-01         9.7   9.768893

Run Code Online (Sandbox Code Playgroud)

我怎么做？

重要评论:

当我命令print type(DataFrame.index[0])找出索引的数据类型时,我得到:

<class 'pandas.tslib.Timestamp'>

Run Code Online (Sandbox Code Playgroud)

只是为了让你知道这是一个熊猫时间戳.

python datetime timestamp pandas

abu*_*nte

2016 01-30

1
推荐指数

1
解决办法

758
查看次数

使用pandas dataframe合并CSV

我使用以下代码.我的所有CSV文件都具有统一的结构.形成数据框时,它在我的CSV中包含两列日期.

在结果数据框中,对于少数行,日期值在第一个日期列中,而对于其余数据,它将转到第二个日期列.

不知道为什么要为源CSV文件中的一列生成两列(日期列).

all_data = pd.DataFrame()
for f in glob.glob("/Users/tcssig/Desktop/Files/*.csv"):
    df = pd.read_csv(f)
    all_data = all_data.append(df,ignore_index=True)

In [76]: all_data.columns
Out[76]: Index(['0', '0.1', 'Channel_ID', 'Date', 'Date ', 'Duration (HH:MM)','Episode #', 'Image', 'Language', 'Master House ID', 'Parental Rating','Program Category', 'Program Title', 'StartTime_ET', 'StartTime_ET2','Synopsis'],
 dtype='object')

Run Code Online (Sandbox Code Playgroud)

python csv pandas

Sar*_*ang

2016 09-06

1
推荐指数

1
解决办法

68
查看次数

在pandas中追加2个以上的数据框

我有大约 25 个具有相同列标题的数据框，我需要将它们相互附加。我过去曾使用 24 次 .append() 调用尝试过此操作，但没有成功。有没有一种简单的方法可以做到这一点？

dataframe python-3.x pandas

Jos*_*osh

2015 12-04

0
推荐指数

1
解决办法

1万
查看次数

根据列表中的位置将列表转换为python字典

我有一个这样的列表:

c = ['A','B','C']

Run Code Online (Sandbox Code Playgroud)

我希望它将它转换为dict像对象一样

d = {"alphabets":{"0":"A","1":"B","2":"C"}}

Run Code Online (Sandbox Code Playgroud)

我目前已实现以下代码:

c = ["A","B","C"]
d={}
for i in range(len(c)):
    d.update({"alphabets":{str(i): c[i]}})
print d

Run Code Online (Sandbox Code Playgroud)

但这给出了输出{'alphabets': {'2': 'C'}}.有谁知道如何处理这个bug？

python iteration dictionary list

abh*_*610

2016 01-20

0
推荐指数

1
解决办法

445
查看次数

标签统计

python ×9

pandas ×7

dataframe ×2

bar-chart ×1

csv ×1

datetime ×1

datetimeindex ×1

decorator ×1

dictionary ×1

iteration ×1

list ×1

list-comprehension ×1

python-3.x ×1

seaborn ×1

timestamp ×1

标签 统计

小编Ant_pov的帖子

标签统计