如何根据pandas中某些列中的值从DataFrame中选择行?
在SQL中我会使用:
SELECT *
FROM table
WHERE colume_name = some_value
Run Code Online (Sandbox Code Playgroud)
我试着看看熊猫文档,但没有立即找到答案.
有人能解释这三种切片方法有何不同?
我已经看过这些文档了,我已经看到了这些 答案,但我仍然发现自己无法解释三者是如何不同的.对我来说,它们在很大程度上似乎是可以互换的,因为它们处于较低的切片水平.
例如,假设我们想获得a的前五行DataFrame.这三个都是如何运作的?
df.loc[:5]
df.ix[:5]
df.iloc[:5]
Run Code Online (Sandbox Code Playgroud)
有人可以提出三种情况,其中使用的区别更清晰吗?
我刚刚将我的Pandas从0.11升级到0.13.0rc1.现在,该应用程序正在弹出许多新的警告.其中一个是这样的:
E:\FinReporter\FM_EXT.py:449: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_index,col_indexer] = value instead
quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE
Run Code Online (Sandbox Code Playgroud)
我想知道究竟是什么意思?我需要改变什么吗?
如果我坚持使用,我应该如何暂停警告quote_df['TVol'] = quote_df['TVol']/TVOL_SCALE?
def _decode_stock_quote(list_of_150_stk_str):
"""decode the webpage and return dataframe"""
from cStringIO import StringIO
str_of_all = "".join(list_of_150_stk_str)
quote_df = pd.read_csv(StringIO(str_of_all), sep=',', names=list('ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefg')) #dtype={'A': object, 'B': object, 'C': np.float64}
quote_df.rename(columns={'A':'STK', 'B':'TOpen', 'C':'TPCLOSE', 'D':'TPrice', 'E':'THigh', 'F':'TLow', 'I':'TVol', 'J':'TAmt', 'e':'TDate', 'f':'TTime'}, inplace=True)
quote_df = quote_df.ix[:,[0,3,2,1,4,5,8,9,30,31]]
quote_df['TClose'] = quote_df['TPrice']
quote_df['RT'] …Run Code Online (Sandbox Code Playgroud) 我注意到在Pandas DataFrame中选择一个列的三种方法:
使用loc选择列的第一种方法:
df_new = df.loc[:, 'col1']
Run Code Online (Sandbox Code Playgroud)
第二种方法 - 看起来更简单,更快捷:
df_new = df['col1']
Run Code Online (Sandbox Code Playgroud)
第三种方法 - 最方便:
df_new = df.col1
Run Code Online (Sandbox Code Playgroud)
这三种方法有区别吗?我不这么认为,在这种情况下我宁愿使用第三种方法.
我很好奇为什么似乎有三种方法可以做同样的事情.
我有一个包含这些索引和值的数据框:
df[df.columns[0]]
1 example
2 example1
3 example2
Run Code Online (Sandbox Code Playgroud)
当我访问df [df.columns [0]] [2]时,我得到"example1".说得通.这就是指数的运作方式.
然而,当我访问df [df.columns [0]]时,我得到了"example",当我访问df [df.columns [1]]时我得到了例子.因此对于
df[df.columns[0]][0]
df[df.columns[0]][1]
Run Code Online (Sandbox Code Playgroud)
我得到"榜样".
奇怪的是,我可以删除"row"0,结果是1被删除:
gf = df.drop(df.index[[0]])
gf
exampleDF
2 example1
3 example2
Run Code Online (Sandbox Code Playgroud)
但是当我删除第1行时,那么
2 example1
Run Code Online (Sandbox Code Playgroud)
被删除,而不是示例.
这对我来说有点混乱; Pandas中关于行索引的标准是否存在不一致,或者我是否遗漏了某些内容/出错?