pandas chained_assignment 警告异常处理

HeX*_*Xor 5 python exception-handling pandas

如果你在Python曾与熊猫你dataframes的切片工作的时候就已经知道chained_assignment警告(如例如描述这里)。

我找到了pandas.options.mode.chained_assignment可以设置为的选项

  • None,忽略警告
  • "warn", 打印警告信息
  • "raise", 引发异常

文档比较

我包含了一个最小示例,在try..except..else异常处理块中触发此警告。我希望仅使用设置触发异常pandas.options.mode.chained_assignment = "raise",如下面的示例 3 所示。

在这个最小的示例中,行为符合预期,因此示例 2 pandas.options.mode.chained_assignment = "warn"仅导致打印警告消息,但不会引发异常。

然而,在一个更大的框架中,我看到一个异常被引发,即使参数被设置为pandas.options.mode.chained_assignment = "warn",就像在最小的例子中一样之前用打印检查(见示例 4)

是否有任何其他 Pandas 参数会影响此有关异常引发的警告消息的行为?


这是一个最小的代码示例,设置/打印pd.options.mode.chained_assignment参数并在try..catch..except块中显示行为。

import pandas as pd

# set the chained_assignment option
pd.options.mode.chained_assignment = "raise" # raises exception in case of warning
pd.options.mode.chained_assignment = "warn"  # prints warning in case of warning, no exception is raised
pd.options.mode.chained_assignment = None    # no warning message and no exception is raised

print "pd.options.mode.chained_assignment :", pd.options.mode.chained_assignment

# create a default pandas dataframe with two columns A,B
df = pd.DataFrame({"A" : [0, 1, 2], "B" : [3, 4, 5]})

print df

# exctract a slice of the given pandas dataframe
df2 = df[df["A"] > 0]

# exception handling
try :
    # try to modify the slice, triggering the pandas warning
    df2["C"] = 2
except :
    print "EXCEPTION RAISED"
else :
    print "NO EXCEPTION"

print df2
Run Code Online (Sandbox Code Playgroud)

示例 1 设置pd.options.mode.chained_assignment = None结果如下输出(无警告,无异常)

pd.options.mode.chained_assignment : None
   A  B
0  0  3
1  1  4
2  2  5
NO EXCEPTION
   A  B  C
1  1  4  2
2  2  5  2
Run Code Online (Sandbox Code Playgroud)

示例 2 设置pd.options.mode.chained_assignment = "warn"结果如下输出(打印警告,但无异常)

pd.options.mode.chained_assignment : warn
   A  B
0  0  3
1  1  4
2  2  5
NO EXCEPTION
C:\Users\my.name\my\directory\test.py:14:SettingWithCopyWarning: 
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
  df2["C"] = 2
   A  B  C
1  1  4  2
2  2  5  2
Run Code Online (Sandbox Code Playgroud)

示例 3 设置pd.options.mode.chained_assignment = "raise"导致以下输出(引发异常)

pd.options.mode.chained_assignment : raise
A  B
0  0  3
1  1  4
2  2  5
EXCEPTION RAISED
   A  B  C
1  1  4  2
2  2  5  2
Run Code Online (Sandbox Code Playgroud)

示例 4 这是我在具有完全相同测试代码的更大框架中看到的。我没有pd.options.mode.chained_assignment明确设置链式参数,但我看到它被设置为"warn",即使引发了异常

pd.options.mode.chained_assignment warn
   A  B
0  0  3
1  1  4
2  2  5
EXCEPTION RAISED
   A  B  C
1  1  4  2
2  2  5  2
Run Code Online (Sandbox Code Playgroud)

HeX*_*Xor 8

经过长时间的搜索,找到了“坏人”。另一位开发人员在他的模块中包含以下几行

import warnings
warnings.filterwarnings('error')
Run Code Online (Sandbox Code Playgroud)

这会将警告变成异常。有关更多详细信息,请参阅警告包文档

因此我的警告被视为例外,尽管熊猫选项设置为“警告”