标签: pandas-profiling

导入错误:找不到 IProgress。尽管已安装,但请更新 jupyter 和 ipywidgets

我正在使用 jupyter 笔记本并安装。

ipywidgets==7.4.2 widgetsnbextension pandas-profiling=='.0.0
Run Code Online (Sandbox Code Playgroud)

我也跑了:

!jupyter nbextension enable --py widgetsnbextension
Run Code Online (Sandbox Code Playgroud)

但运行时:

from pandas_profiling import ProfileReport
profile = ProfileReport(df, title="Pandas Profiling Report", explorative=True)
profile.to_widgets()
Run Code Online (Sandbox Code Playgroud)

我收到错误:

ImportError: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html
Run Code Online (Sandbox Code Playgroud)

知道为什么吗?尝试了建议的解决方案。

pandas jupyter jupyter-notebook ipywidgets pandas-profiling

50
推荐指数
2
解决办法
12万
查看次数

ImportError:无法从“pandas.core.dtypes.generic”导入名称“ABCIndexClass”

我有这个输出:

[Pandas-profiling] ImportError:无法从“pandas.core.dtypes.generic”导入名称“ABCIndexClass”

当尝试以这种方式导入 pandas-profiling 时:

from pandas_profiling import ProfileReport
Run Code Online (Sandbox Code Playgroud)

它似乎正确导入了 pandas-profiling,但在与 pandas 本身交互时却遇到了困难。这两个库目前都是通过 conda 进行更新的。根据他们的文档,它似乎与 pandas-profiling 相关的任何常见问题都不匹配,而且我似乎无法找到导入 name 的更通用的解决方案ABCIndexClass

谢谢

python pandas pandas-profiling

19
推荐指数
2
解决办法
2万
查看次数

无法导入 Pandas 分析

我无法在 jupyter notebook 中导入 pandas 分析。有人可以告诉我出了什么问题。 在此处输入图片说明

python-3.x pandas jupyter-notebook pandas-profiling

10
推荐指数
2
解决办法
3万
查看次数

由于错误“无法从‘pandas.core.base’导入名称“DataError””,Pandas 分析无法导入

我今天刚刚将Python升级到3.11。Pandas-profiling 以前工作正常,但现在由于以下错误,我似乎无法导入它:

cannot import name 'DataError' from 'pandas.core.base' (C:\Users\User_name\AppData\Local\Programs\Python\Python311\Lib\site-packages\pandas\core\base.py)

Run Code Online (Sandbox Code Playgroud)

关于如何解决这个问题有什么帮助吗?

这是我的代码:

import pandas as pd
from pandas_profiling import ProfileReport
Run Code Online (Sandbox Code Playgroud)

Pandas 版本 - 1.5.2 Pandas-profiling 版本 - 3.2.0

python-3.x pandas jupyter-notebook pandas-profiling

8
推荐指数
2
解决办法
2万
查看次数

如何使用 Pandas 分析来分析大型数据集?

数据并不完全干净,但在使用熊猫时没有问题。pandas 库为 EDA 提供了许多非常有用的函数。

但是,当我对大数据(即 10 亿条记录和 10 列)使用分析时,从数据库表中读取它时,它没有完成并且我的笔记本电脑内存不足,csv 中的数据大小约为 6 GB,我的 RAM 为 14 GB 我的空闲使用量大约是 3 - 4 GB。

df = pd.read_sql_query("select * from table", conn_params)
profile = pandas.profiling.ProfileReport(df)
profile.to_file(outputfile="myoutput.html")
Run Code Online (Sandbox Code Playgroud)

我也尝试过使用check_recoded = False选项。但这对完全分析没有帮助。有什么办法可以对数据进行分块读取,最终生成一个整体的汇总报告?或任何其他方法将此函数用于大型数据集。

python profiling pandas pandas-profiling

7
推荐指数
3
解决办法
9265
查看次数

使用check_correlation加速大熊猫分析分析?

使用熊猫分析生成报告。数据集的大小非常大,以加快处理速度,试图关闭相关性,因此我使用了另一篇我看到的Check_correlations,ValueError:配置参数“ check_correlation”不存在。那是我从使用此行得到的问题

a = prof.ProfileReport(df, title='EXTRACTS', check_correlation=False)
Run Code Online (Sandbox Code Playgroud)

产生这个问题

ValueError:配置参数“ check_correlation”不存在。

python pandas pandas-profiling

6
推荐指数
1
解决办法
314
查看次数

运行 Pandas Profile Report 时出错

我正在尝试在 conda Jupyter NB 中运行 EDA 的配置文件报告,但不断收到错误消息。
到目前为止,这是我的代码:

    import pandas_profiling
    from pandas_profiling import ProfileReport

    profile = ProfileReport(data)
Run Code Online (Sandbox Code Playgroud)

    profile = pandas_profiling.ProfileReport(data)
Run Code Online (Sandbox Code Playgroud)

两者都产生:

类型错误:concat() 得到了一个意外的关键字参数“join_axes”

研究建议升级到我正在使用的 Pandas 1.0。

也试过

    data.profile_report()        
Run Code Online (Sandbox Code Playgroud)

AttributeError: 'DataFrame' 对象没有属性 'profile_report'

关于我哪里出错的任何提示?

附录……所以我终于想通了。需要在 conda 中安装最新版本的 pandas-profiling,即 202003 版本。太容易了。

python pandas pandas-profiling

6
推荐指数
2
解决办法
9145
查看次数

PydanticImportError:“BaseSettings”已移至“pydantic-settings”包

我从 kaggle 下载了泰坦尼克号数据集。我正在通过安装 pandas_profiling 来实现 pandas 的分析

我们将不胜感激您的贡献!

import pandas as pd 
df = pd.read_csv('E:/pythonWorkspace/excelFiles/train.csv')
df.head()

from pandas_profiling import ProfileReport
prof = ProfileReport(df) #object created!
prof.to_file(output_file='output.html')
Run Code Online (Sandbox Code Playgroud)

错误 :

PydanticImportError: `BaseSettings` has been moved to the `pydantic-settings` package. See https://docs.pydantic.dev/2.0.2/migration/#basesettings-has-moved-to-pydantic-settings for more details.

For further information visit https://errors.pydantic.dev/2.0.2/u/import-error
Run Code Online (Sandbox Code Playgroud)

python pandas pandas-profiling

6
推荐指数
1
解决办法
9497
查看次数

Juypter 笔记本 pandas_profiling:无法从“pandas_profiling.report”导入名称“to_html”

我正在尝试导入熊猫分析。

import pandas as pd !pip install pandas_profiling import pandas_profiling as pp

但是,有一条错误消息说无法从“pandas_profiling.report”导入名称“to_html”

python pandas-profiling

5
推荐指数
1
解决办法
1664
查看次数

ImportError:选择默认后端“Matplotlib”时绘制Matplotlib

我是 pandas_profiling 的新手,并且在导入时遇到了 ImportError。请帮忙。

import numpy as np
import pandas as pd
import pandas_profiling
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
%matplotlib inline
import seaborn as sns
Run Code Online (Sandbox Code Playgroud)

在 jupyter notebook 中执行上述代码后,出现以下错误。

ImportError:选择默认后端“Matplotlib”时,需要Matplotlib。

> python --version
Python 3.7.3

> 点子列表 | grep -E "matplotlib|pandas"
matplotlib 3.2.0
熊猫 0.25.3
熊猫分析 2.5.3

python linux matplotlib pandas pandas-profiling

5
推荐指数
1
解决办法
1万
查看次数