相关疑难解决方法(0)

如何在Pandas中处理SettingWithCopyWarning？

背景

我刚刚将我的Pandas从0.11升级到0.13.0rc1.现在,该应用程序正在弹出许多新的警告.其中一个是这样的:

E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_index,col_indexer] = value instead
  quote_df['TVol']   = quote_df['TVol']/TVOL_SCALE

Run Code Online (Sandbox Code Playgroud)

我想知道究竟是什么意思？我需要改变什么吗？

如果我坚持使用,我应该如何暂停警告quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE？

给出错误的函数

def _decode_stock_quote(list_of_150_stk_str):
    """decode the webpage and return dataframe"""

    from cStringIO import StringIO

    str_of_all = "".join(list_of_150_stk_str)

    quote_df = pd.read_csv(StringIO(str_of_all), sep=',', names=list('ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefg')) #dtype={'A': object, 'B': object, 'C': np.float64}
    quote_df.rename(columns={'A':'STK', 'B':'TOpen', 'C':'TPCLOSE', 'D':'TPrice', 'E':'THigh', 'F':'TLow', 'I':'TVol', 'J':'TAmt', 'e':'TDate', 'f':'TTime'}, inplace=True)
    quote_df = quote_df.ix[:,[0,3,2,1,4,5,8,9,30,31]]
    quote_df['TClose'] = quote_df['TPrice']
    quote_df['RT'] …

Run Code Online (Sandbox Code Playgroud)

python dataframe pandas chained-assignment

big*_*bug

2017 12-02

536
推荐指数

16
解决办法

58万
查看次数

Pythonic /有效的方法从每个Pandas数据帧单元中剥离空格,其中包含类似字符串的对象

我正在将CSV文件读入DataFrame.我需要从所有类似字符串的单元格中删除空格,而在Python 2.7中保留其他单元格不变.

这是我正在做的事情:

def remove_whitespace( x ):
    if isinstance( x, basestring ):
        return x.strip()
    else:
        return x

my_data = my_data.applymap( remove_whitespace )

Run Code Online (Sandbox Code Playgroud)

Pandas有没有比这更好或更惯用的方法呢？

是否有更有效的方式(也许是通过列方式做事)？

我试过寻找一个明确的答案,但是关于这个主题的大多数问题似乎是如何从列名本身中去除空格,或者假设单元格都是字符串.

python dataframe pandas

dea*_*ode

2015 11-19

32
推荐指数

4
解决办法

6万
查看次数

具有列表元素的熊猫数据框：拆分，填充

我有一个熊猫数据框（NROWS x 1），其中每一行都是一个列表，例如

    y 
0   [[aa, bb], 0000001]   
1   [[uz, mk], 0000011]

Run Code Online (Sandbox Code Playgroud)

我想展平列表并分成（在这种情况下为三）列，如下所示：

    1  2  3
0   aa bb 0000001
1   uz mk 0000011

Run Code Online (Sandbox Code Playgroud)

此外，不同的行具有不相等的长度：

    y
0   [[aa, bb], 0000001]
1   [[mk], 0000011]

Run Code Online (Sandbox Code Playgroud)

我真正想要结束的是，检测所有行的最大长度，并将其余行填充为空字符串”。在这个例子中

    1  2  3
0   aa bb 0000001
1   '' mk 0000011

Run Code Online (Sandbox Code Playgroud)

我一直在玩.values.tolist（），但是它并不能满足我的需要。

编辑- 以下答案非常简洁，非常感谢。我正在编辑，以包括一个解决方案，用于解决类似但更简单的问题，以确保完整性。

读取数据，使用Strip的trim（）fn /修剪数据帧的所有字符串，以确保没有左/右空格

df = pd.read_csv('data.csv',sep=',',dtype=str)
df = trim_all_columns(df)

Run Code Online (Sandbox Code Playgroud)

保留分类/名义ID和CODE列，删除所有不适用

df.dropna(subset=['dg_cd'] , inplace=True) # drop dg_cd is NaN rows from df 

df2 = df[['id','dg_cd']]

Run Code Online (Sandbox Code Playgroud)

通过ID将CODE变成句子，并保留所有重复的实例

x = df2.groupby('id').apply(lambda x: x['dg_cd'].values.tolist()).apply(pd.Series).replace(np.nan, …

Run Code Online (Sandbox Code Playgroud)

python pandas

use*_*205

2019 06-12

5
推荐指数

1
解决办法

104
查看次数

pandas replace contents of multiple columns at a time for multiple conditions

I have a df as follows:

    CHROM     POS   SRR4216489              SRR4216675                  SRR4216480
0     1  127536     ./.                     ./.                         ./. 
1     1  127573     ./.                     0/1:0,5:5:0:112,1,10        ./.
2     1  135032     ./.                     1/1:13,0:13:3240:0,30,361   0/0:13,0:13:3240:0,30,361
3     1  135208     ./.                     0/0:5,0:5:3240:0,20,160     0/1:5,0:5:3240:0,20,160
4     1  138558     1/1:5,0:5:3240:0,29,177 0/0:0,5:5:0:112,1,10        ./.

Run Code Online (Sandbox Code Playgroud)

I would like to replace the contents of the sample columns depending on certain conditions. The sample columns are SRR4216489, SRR4216675, SRR4216480. I am looking to replace './.' with 0.5, anything with 0/0 at the start with 0.0 and …

python dataframe pandas

use*_*260

lucky-day

2
推荐指数

1
解决办法

5870
查看次数