我刚刚将我的Pandas从0.11升级到0.13.0rc1.现在,该应用程序正在弹出许多新的警告.其中一个是这样的:
E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_index,col_indexer] = value instead
quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE
Run Code Online (Sandbox Code Playgroud)
我想知道究竟是什么意思?我需要改变什么吗?
如果我坚持使用,我应该如何暂停警告quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE?
def _decode_stock_quote(list_of_150_stk_str):
"""decode the webpage and return dataframe"""
from cStringIO import StringIO
str_of_all = "".join(list_of_150_stk_str)
quote_df = pd.read_csv(StringIO(str_of_all), sep=',', names=list('ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefg')) #dtype={'A': object, 'B': object, 'C': np.float64}
quote_df.rename(columns={'A':'STK', 'B':'TOpen', 'C':'TPCLOSE', 'D':'TPrice', 'E':'THigh', 'F':'TLow', 'I':'TVol', 'J':'TAmt', 'e':'TDate', 'f':'TTime'}, inplace=True)
quote_df = quote_df.ix[:,[0,3,2,1,4,5,8,9,30,31]]
quote_df['TClose'] = quote_df['TPrice']
quote_df['RT'] …Run Code Online (Sandbox Code Playgroud) 如果我有一个类似于这个的数据帧
Apples Bananas Grapes Kiwis
2 3 nan 1
1 3 7 nan
nan nan 2 3
Run Code Online (Sandbox Code Playgroud)
我想添加一个这样的列
Apples Bananas Grapes Kiwis Fruit Total
2 3 nan 1 6
1 3 7 nan 11
nan nan 2 3 5
Run Code Online (Sandbox Code Playgroud)
我想你可以使用df['Apples'] + df['Bananas']等等,但我的实际数据帧比这大得多.我希望一个公式df['Fruit Total']=df[-4:-1].sum可以在一行代码中完成这个技巧.然而,这没有奏效.有没有办法在没有明确总结所有列的情况下做到这一点?
我有一个如下所示的数据框:
a1 b1 c1 a2 b2 c2 a3 ...
x 1.2 1.3 1.2 ... ... ... ...
y 1.4 1.2 ... ... ... ... ...
z ...
Run Code Online (Sandbox Code Playgroud)
我想要的是每第n列分组.换句话说,我想要一个包含所有as的数据帧,一个用bs,一个用cs
a1 a2 a4
x 1.2 ... ...
y
z
Run Code Online (Sandbox Code Playgroud)
在另一个SO问题中,我看到有可能做到df.iloc[::5,:],例如,获得每个第5个原始数据.我当然可以做到df.iloc[:,::3]c cols但是它不能用于获得a和b.
有任何想法吗?
我有一个这样的 df :
column A column B column C .... ColumnZ
index
X 1 4 7 10
Y 2 5 8 11
Z 3 6 9 12
Run Code Online (Sandbox Code Playgroud)
对于我的生活,我无法弄清楚如何对每列的行进行求和,以得出求和 df:
column A column B column C .... ColumnZ
index
total 6 16 25 33
Run Code Online (Sandbox Code Playgroud)
有什么想法吗?
给定一个数据框,如下所示:
x1 x2 x3 x4 x5 x6
1 2 3 4 5 6
3 4 5 6 3 3
1 2 3 6 1 2
Run Code Online (Sandbox Code Playgroud)
我如何创建一个新的“sum”列,它只添加 x1 + x3 + x4
x1 x2 x3 x4 x5 x6
1 2 3 4 5 6
3 4 5 6 3 3
1 2 3 6 1 2
Run Code Online (Sandbox Code Playgroud)
在我的实际数据框中,我有大约 100 列,所以有没有办法做到这一点而不必手动编写 x1 + x3 + ... + xn
例如,给定一个列表 [x1, x3, x4.. xn] df['sum'] = sum(df[list]) ?任何帮助表示赞赏,谢谢。
我正在尝试将字典中的元素写入一个文本文件,其中每个键都是一列。目前有我看起来像
import csv
import numpy as np
data1 = np.arange(10)
data2 = np.arange(10)*2
data3 = np.arange(10)*3
writefile = '../Desktop/data.txt'
datadict = {}
datadict['data1'] = data1
datadict['data2'] = data2
datadict['data3'] = data3
f = open( writefile, 'w' )
fieldnames = ['data1','data2', 'data3']
data = csv.DictWriter(writefile, fieldnames, restval='', extrasaction='ignore', dialect='excel')
f.close()
Run Code Online (Sandbox Code Playgroud)
但这给了我错误“参数1必须具有“写入”方法”。我不确定那是什么意思。我也担心方言=“ excel”,但是我不确定还有什么。最后,我想要一个看起来像这样的文件:

谢谢