相关疑难解决方法(0)

了解切片表示法

我需要在Python的切片表示法上有一个很好的解释(引用是一个加号).

对我来说,这种符号需要一点点提升.

它看起来非常强大,但我还没有完全了解它.

python iterable list slice

Sim*_*mon

2019 05-09

3024
推荐指数

33
解决办法

159万
查看次数

如何在Pandas中处理SettingWithCopyWarning？

背景

我刚刚将我的Pandas从0.11升级到0.13.0rc1.现在,该应用程序正在弹出许多新的警告.其中一个是这样的:

E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_index,col_indexer] = value instead
  quote_df['TVol']   = quote_df['TVol']/TVOL_SCALE

Run Code Online (Sandbox Code Playgroud)

我想知道究竟是什么意思？我需要改变什么吗？

如果我坚持使用,我应该如何暂停警告quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE？

给出错误的函数

def _decode_stock_quote(list_of_150_stk_str):
    """decode the webpage and return dataframe"""

    from cStringIO import StringIO

    str_of_all = "".join(list_of_150_stk_str)

    quote_df = pd.read_csv(StringIO(str_of_all), sep=',', names=list('ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefg')) #dtype={'A': object, 'B': object, 'C': np.float64}
    quote_df.rename(columns={'A':'STK', 'B':'TOpen', 'C':'TPCLOSE', 'D':'TPrice', 'E':'THigh', 'F':'TLow', 'I':'TVol', 'J':'TAmt', 'e':'TDate', 'f':'TTime'}, inplace=True)
    quote_df = quote_df.ix[:,[0,3,2,1,4,5,8,9,30,31]]
    quote_df['TClose'] = quote_df['TPrice']
    quote_df['RT'] …

Run Code Online (Sandbox Code Playgroud)

python dataframe pandas chained-assignment

big*_*bug

2017 12-02

536
推荐指数

16
解决办法

58万
查看次数

按整数索引选择一行pandas系列/ dataframe

我很好奇为什么df[2]不受支持,df.ix[2]而且df[2:3]两者都有效.

In [26]: df.ix[2]
Out[26]: 
A    1.027680
B    1.514210
C   -1.466963
D   -0.162339
Name: 2000-01-03 00:00:00

In [27]: df[2:3]
Out[27]: 
                  A        B         C         D
2000-01-03  1.02768  1.51421 -1.466963 -0.162339

Run Code Online (Sandbox Code Playgroud)

我期望df[2]以df[2:3]与Python索引约定一致的方式工作.是否存在不支持单个整数索引行的设计原因？

python indexing dataframe pandas

作者

2017 12-15

362
推荐指数

6
解决办法

69万
查看次数

如何在pandas中获取数据帧的列切片

我从CSV文件中加载了一些机器学习数据.前两列是观察,其余列是特征.

目前,我做以下事项:

data = pandas.read_csv('mydata.csv')

Run Code Online (Sandbox Code Playgroud)

这给出了类似的东西:

data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))

Run Code Online (Sandbox Code Playgroud)

我想两个dataframes切片此数据框:一个包含列a,并b和包含列一个c,d和e.

写不出类似的东西是不可能的

observations = data[:'c']
features = data['c':]

Run Code Online (Sandbox Code Playgroud)

我不确定最好的方法是什么.我需要一个pd.Panel吗？

顺便说一句,我发现数据帧索引非常不一致:data['a']是允许的,但data[0]不是.另一方面,data['a':]不允许,但是data[0:].这是否有实际原因？如果列被Int索引,这实在令人困惑data[0] != data[0:1]

python numpy slice dataframe pandas

cpa*_*cpa

2019 01-22

238
推荐指数

7
解决办法

41万
查看次数

pandas loc vs. iloc vs. ix vs. at vs. iat？

最近开始从我的安全地点(R)扩展到Python,并且对于细胞定位/选择感到有些困惑Pandas.我已经阅读了文档,但我很难理解各种本地化/选择选项的实际意义.

我有理由选择使用.loc或.iloc超过最常用的选项.ix吗？
我的理解是.loc,iloc,at,和iat可以提供一些保证正确性是.ix不能提供的,但我也看到了在那里.ix往往是一刀切最快的解决方案.
请解释除了使用其他任何东西背后的现实世界,最佳实践推理.ix？

python lookup indexing performance pandas

use*_*042

2018 08-24

157
推荐指数

4
解决办法

9万
查看次数

如何将pandas DataFrame的第一列作为一个系列？

我试过了:

x=pandas.DataFrame(...)
s = x.take([0], axis=1)

Run Code Online (Sandbox Code Playgroud)

并s获得一个DataFrame,而不是一个系列.

python series dataframe pandas

Yar*_*riv

2013 03-12

126
推荐指数

4
解决办法

26万
查看次数

将列表或系列作为一行添加到pandas DataFrame中？

所以我初始化了一个空的pandas DataFrame,我想在这个DataFrame中迭代地将列表(或Series)作为行附加.这样做的最佳方式是什么？

python append dataframe pandas

Wes*_*eld

lucky-day

86
推荐指数

8
解决办法

23万
查看次数

在pandas数据帧中查找具有NaN的行的整数索引

我有一个像这样的pandas DataFrame:

                    a         b
2011-01-01 00:00:00 1.883381  -0.416629
2011-01-01 01:00:00 0.149948  -1.782170
2011-01-01 02:00:00 -0.407604 0.314168
2011-01-01 03:00:00 1.452354  NaN
2011-01-01 04:00:00 -1.224869 -0.947457
2011-01-01 05:00:00 0.498326  0.070416
2011-01-01 06:00:00 0.401665  NaN
2011-01-01 07:00:00 -0.019766 0.533641
2011-01-01 08:00:00 -1.101303 -1.408561
2011-01-01 09:00:00 1.671795  -0.764629

Run Code Online (Sandbox Code Playgroud)

有没有一种有效的方法来找到具有NaNs的行的"整数"索引？在这种情况下,所需的输出应该是[3, 6].

python pandas

作者

2018 05-04

77
推荐指数

7
解决办法

11万
查看次数

.ix()总是优于.loc()和.iloc(),因为它更快并且支持整数和标签访问吗？

我正在学习Python pandas库.来自R背景,索引和选择功能似乎比它们需要的更复杂.我理解.loc()只是基于标签而.iloc()只是基于整数.

如果.ix()更快并支持整数和标签访问,为什么我应该使用.loc()和.iloc()？

python pandas

meg*_*ger

2018 01-31

67
推荐指数

1
解决办法

7万
查看次数

使用pandas选择以多个等价物为条件的行

我有一个pandas df,并想在这些方面完成一些事情(用SQL术语):

SELECT * FROM df WHERE column1 = 'a' OR column2 = 'b' OR column3 = 'c' etc.

Run Code Online (Sandbox Code Playgroud)

现在这适用于一个列/值对:

foo = df.loc[df['column']==value]

Run Code Online (Sandbox Code Playgroud)

但是,我不确定如何将其扩展为多个列/值对

python pandas

Tyl*_*ood

2019 10-04

53
推荐指数

3
解决办法

11万
查看次数

标签统计

python ×10

pandas ×9

dataframe ×5

indexing ×2

slice ×2

append ×1

chained-assignment ×1

iterable ×1

list ×1

lookup ×1

numpy ×1

performance ×1

series ×1

背景

给出错误的函数

标签 统计

标签统计