相关疑难解决方法(0)

更好的方法来放弃熊猫中的纳米行

我自己找到了一种从熊猫数据帧中删除nan行的方法.给定一个包含nan值的dat列的数据框x,是否有一种更优雅的方法来删除列中的每个行dat都有一个nan值x

dat = dat[np.logical_not(np.isnan(dat.x))]
dat = dat.reset_index(drop=True)
Run Code Online (Sandbox Code Playgroud)

python pandas

41
推荐指数
3
解决办法
9万
查看次数

Python:Pandas中的NaN值仅适用于单个值

我只想检查Pandas系列中的单个单元格是否为空.

即,我想检查一个值是否是NaN.所有其他答案适用于系列和数组,但不适用于单值.

我已经试过pandas.notnull,pandas.isnull,numpy.isnan.是否只有单一价值的解决方案?

python nan pandas

29
推荐指数
3
解决办法
4万
查看次数

如何在"pandas"中按列获取缺失/ NaN数据的摘要计数?

R中,我可以使用该summary命令快速查看缺失数据的计数,但是等效的pandasDataFrame方法describe不会报告这些值.

我知道我可以做点什么

len(mydata.index) - mydata.count()
Run Code Online (Sandbox Code Playgroud)

计算每列的缺失值的数量,但我想知道是否有更好的习语(或者我的方法是否正确).

reporting nan missing-data pandas

25
推荐指数
3
解决办法
5万
查看次数

如何检查pandas DataFrame中的特定单元格是否为空?

df在熊猫中有以下内容.

0       A     B     C
1       2   NaN     8
Run Code Online (Sandbox Code Playgroud)

我如何检查是否df.iloc[1]['B']是NaN?

我尝试使用df.isnan(),我得到一个这样的表:

0       A     B      C
1   false  true  false
Run Code Online (Sandbox Code Playgroud)

但我不知道如何索引表格,以及这是否是一种有效的工作方式?

python dataframe pandas

7
推荐指数
1
解决办法
3万
查看次数

更多惯用版的"df.isnull().any().any()"w/a Pandas DataFrame?

df.isnull().any().any()
Run Code Online (Sandbox Code Playgroud)

此行的计算结果为布尔值True/False,因为它检查Pandas数据帧是否在其行或列中包含任何NaN.是否有更简洁/惯用的方式来检查这个?

python pandas

5
推荐指数
1
解决办法
940
查看次数

Python-pandas,np.nan

请你们帮我解释一下下面的代码:

为什么 anan不是np.nan

import pandas as pd
import numpy as np

df.iloc[31464]['SalesPersonID']
[out]:
nan

df.iloc[31464]['SalesPersonID'] is np.nan
[out]:
False
Run Code Online (Sandbox Code Playgroud)

谢谢你们。

python nan pandas

4
推荐指数
1
解决办法
2431
查看次数

用相关列的平均值替换数据框中的 NaN 值的函数

编辑:这个问题不是pandas数据框的克隆,用列的平均值替换nan值,因为我想用列的平均值而不是数据框值的平均值替换每列的值。

我有一个train包含一百列的Pandas 数据框 ( ),我必须对其应用机器学习技术。

通常我手工制作特征工程,但在这种情况下,我有很多列要处理。

我想构建一个 Python 函数:

1)找到NaN每列中的值(我想过df.isnull().any()

2) 对于每个NaN值,将其替换为找到 NaN 值的列的平均值。

我的想法是这样的:

def replace(value):
    for value in train:
        if train['value'].isnull():
           train['value'] = train['value'].fillna(train['value'].mean())

train = train.apply(replace,axis=1)
Run Code Online (Sandbox Code Playgroud)

但我收到以下错误

---------------------------------------------------------------------------
KeyError                                  Traceback (most recent call last)
/opt/conda/lib/python3.6/site-packages/pandas/core/indexes/base.py in get_loc(self, key, method, tolerance)
   3063             try:
-> 3064                 return self._engine.get_loc(key)
   3065             except KeyError:

pandas/_libs/index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas/_libs/index.pyx in pandas._libs.index.IndexEngine.get_loc()

pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item()

pandas/_libs/hashtable_class_helper.pxi in pandas._libs.hashtable.PyObjectHashTable.get_item()

KeyError: 'value' …
Run Code Online (Sandbox Code Playgroud)

python numpy dataframe pandas

3
推荐指数
2
解决办法
1万
查看次数

标签 统计

pandas ×7

python ×6

nan ×3

dataframe ×2

missing-data ×1

numpy ×1

reporting ×1