小编Bra*_*mon的帖子

在Python pandas中向现有DataFrame添加新列

我有以下索引的DataFrame与命名列和行不连续数字:

          a         b         c         d
2  0.671399  0.101208 -0.181532  0.241273
3  0.446172 -0.243316  0.051767  1.577318
5  0.614758  0.075793 -0.451460 -0.012493
Run Code Online (Sandbox Code Playgroud)

我想'e'在现有数据框中添加一个新列,并且不希望更改数据框中的任何内容(即,新列始终与DataFrame具有相同的长度).

0   -0.335485
1   -1.166658
2   -0.385571
dtype: float64
Run Code Online (Sandbox Code Playgroud)

我尝试了不同的版本join,append,merge,但我没有得到我想要的结果,只在最错误.如何e在上面的示例中添加列?

python dataframe pandas chained-assignment

887
推荐指数
23
解决办法
182万
查看次数

如何在Pandas中处理SettingWithCopyWarning?

背景

我刚刚将我的Pandas从0.11升级到0.13.0rc1.现在,该应用程序正在弹出许多新的警告.其中一个是这样的:

E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_index,col_indexer] = value instead
  quote_df['TVol']   = quote_df['TVol']/TVOL_SCALE
Run Code Online (Sandbox Code Playgroud)

我想知道究竟是什么意思?我需要改变什么吗?

如果我坚持使用,我应该如何暂停警告quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE

给出错误的函数

def _decode_stock_quote(list_of_150_stk_str):
    """decode the webpage and return dataframe"""

    from cStringIO import StringIO

    str_of_all = "".join(list_of_150_stk_str)

    quote_df = pd.read_csv(StringIO(str_of_all), sep=',', names=list('ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefg')) #dtype={'A': object, 'B': object, 'C': np.float64}
    quote_df.rename(columns={'A':'STK', 'B':'TOpen', 'C':'TPCLOSE', 'D':'TPrice', 'E':'THigh', 'F':'TLow', 'I':'TVol', 'J':'TAmt', 'e':'TDate', 'f':'TTime'}, inplace=True)
    quote_df = quote_df.ix[:,[0,3,2,1,4,5,8,9,30,31]]
    quote_df['TClose'] = quote_df['TPrice']
    quote_df['RT'] …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas chained-assignment

536
推荐指数
16
解决办法
58万
查看次数

为什么在C++头文件中使用#ifndef和#define?

我一直在头文件的开头看到这样的代码:

#ifndef HEADERFILE_H
#define HEADERFILE_H
Run Code Online (Sandbox Code Playgroud)

并在文件的最后是

#endif
Run Code Online (Sandbox Code Playgroud)

这样做的目的是什么?

c c++ c-preprocessor

458
推荐指数
4
解决办法
39万
查看次数

Vim:在多行中插入相同的字符

有时我想跨多行编辑某个可视文本块.

例如,我会采用如下所示的文本:

name
comment
phone
email
Run Code Online (Sandbox Code Playgroud)

让它像这样扯掉

vendor_name
vendor_comment
vendor_phone
vendor_email
Run Code Online (Sandbox Code Playgroud)

目前,我现在的方式是......

  1. 按下V然后按j4次选择所有4行块.
  2. 缩进>.
  3. 回去一封信h.
  4. 转到阻止视觉模式ctrlv.
  5. j4次选择向下4行.此时,您已选择了一个4x1的空白视觉块(4行,1列).
  6. c.请注意,这一列几乎向左缩进了一列.
  7. 输入" vendor_"没有引用的a.注意我们不得不放回的额外空间.
  8. esc.这是我用于esc退出插入模式的极少数时间之一.ctrlc只会编辑第一行.
  9. 重复步骤1.
  10. 用另一种方式缩进<.

如果在单词之前至少有一列空格,我不需要缩进.如果我不必清除视觉块,我就不需要空格c.

但是如果我必须清除,那么有没有办法在不创建所需的缩进空格的情况下执行上面执行的操作?

此外为什么用退出了插入模式编辑一次只能工作多行escctrlc

编辑:

这是一个更复杂的例子

name    = models.CharField( max_length = 135 )
comment = models.TextField( blank = True )
phone   = models.CharField( max_length = …
Run Code Online (Sandbox Code Playgroud)

vim

283
推荐指数
11
解决办法
13万
查看次数

在Python中的列表中获取每个元组的第一个元素

SQL查询为我提供了一个元组列表,如下所示:

[(elt1, elt2), (elt1, elt2), (elt1, elt2), (elt1, elt2), (elt1, elt2), ...]
Run Code Online (Sandbox Code Playgroud)

我想拥有每个元组的所有第一个元素.现在我用这个:

rows = cur.fetchall()
res_list = []
for row in rows:
    res_list += [row[0]]
Run Code Online (Sandbox Code Playgroud)

但我认为可能有更好的语法来做到这一点.你知道更好的方法吗?

python syntax python-2.7

110
推荐指数
5
解决办法
24万
查看次数

Pandas使用什么规则来生成视图和副本?

我对Pandas在决定数据帧中的选择是原始数据帧的副本还是原始数据的视图时使用的规则感到困惑.

如果我有,例如,

df = pd.DataFrame(np.random.randn(8,8), columns=list('ABCDEFGH'), index=range(1,9))
Run Code Online (Sandbox Code Playgroud)

我明白a query返回一个副本,就像这样

foo = df.query('2 < index <= 5')
foo.loc[:,'E'] = 40
Run Code Online (Sandbox Code Playgroud)

对原始数据帧没有影响df.我也理解标量或命名切片返回一个视图,以便分配给这些,例如

df.iloc[3] = 70
Run Code Online (Sandbox Code Playgroud)

要么

df.ix[1,'B':'E'] = 222
Run Code Online (Sandbox Code Playgroud)

会改变df.但是当谈到更复杂的案件时,我迷失了方向.例如,

df[df.C <= df.B]  = 7654321
Run Code Online (Sandbox Code Playgroud)

变化df,但是

df[df.C <= df.B].ix[:,'B':'E']
Run Code Online (Sandbox Code Playgroud)

才不是.

是否有一个简单的规则,熊猫正在使用,我只是缺少?在这些特定情况下发生了什么; 特别是,如何更改满足特定查询的数据帧中的所有值(或值的子集)(正如我在上一个示例中尝试做的那样)?


注意:这与此问题不同 ; 我已经阅读了文档,但没有得到它的启发.我还阅读了关于这个主题的"相关"问题,但我仍然缺少Pandas正在使用的简单规则,以及我如何应用它 - 例如 - 修改值(或值的子集)在满足特定查询的数据框中.

python indexing dataframe pandas chained-assignment

98
推荐指数
1
解决办法
3万
查看次数

HDF5 - 并发,压缩和I/O性能

我有关于HDF5性能和并发性的以下问题:

  1. HDF5是否支持并发写访问?
  2. 除了并发性考虑外,HDF5在I/O性能方面的表现如何(压缩率是否会影响性能)?
  3. 由于我在Python中使用HDF5,它的性能与Sqlite相比如何?

参考文献:

python sqlite hdf5 pandas

64
推荐指数
1
解决办法
3万
查看次数

为什么类__dict__是mappingproxy?

我想知道为什么一个类__dict__是一个类mappingproxy,但实例__dict__只是一个简单的例子dict

>>> class A:
...     pass

>>> a = A()
>>> type(a.__dict__)
<class 'dict'>
>>> type(A.__dict__)
<class 'mappingproxy'>
Run Code Online (Sandbox Code Playgroud)

python class python-3.x python-internals

60
推荐指数
3
解决办法
8491
查看次数

附加for循环中生成的pandas数据帧

我在for循环中访问一系列Excel文件.然后我将excel文件中的数据读取到pandas数据帧.我无法弄清楚如何将这些数据帧附加到一起,然后将数据帧(现在包含来自所有文件的数据)保存为新的Excel文件.

这是我试过的:

for infile in glob.glob("*.xlsx"):
    data = pandas.read_excel(infile)
    appended_data = pandas.DataFrame.append(data) # requires at least two arguments
appended_data.to_excel("appended.xlsx")
Run Code Online (Sandbox Code Playgroud)

谢谢!

python pandas

54
推荐指数
2
解决办法
10万
查看次数

Python:Pandas Dataframe如何将整个列与标量相乘

如何将数据帧的给定列的每个元素与标量相乘?(我试过看SO,但似乎找不到合适的解决方案)

做类似的事情:

df['quantity'] *= -1 # trying to multiply each row's quantity column with -1
Run Code Online (Sandbox Code Playgroud)

给我一个警告:

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead
Run Code Online (Sandbox Code Playgroud)

注意:如果可能的话,我不想迭代数据帧并执行类似的操作...因为我认为整个列上的任何标准数学运算都应该可以不必编写循环:

for idx, row in df.iterrows():
    df.loc[idx, 'quantity'] *= -1
Run Code Online (Sandbox Code Playgroud)

编辑:

我正在跑0.16.2熊猫

完整的痕迹:

 SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the the …
Run Code Online (Sandbox Code Playgroud)

python pandas chained-assignment

49
推荐指数
7
解决办法
10万
查看次数