我正在使用 jupyter 笔记本并安装。
ipywidgets==7.4.2 widgetsnbextension pandas-profiling=='.0.0
Run Code Online (Sandbox Code Playgroud)
我也跑了:
!jupyter nbextension enable --py widgetsnbextension
Run Code Online (Sandbox Code Playgroud)
但运行时:
from pandas_profiling import ProfileReport
profile = ProfileReport(df, title="Pandas Profiling Report", explorative=True)
profile.to_widgets()
Run Code Online (Sandbox Code Playgroud)
我收到错误:
ImportError: IProgress not found. Please update jupyter and ipywidgets. See https://ipywidgets.readthedocs.io/en/stable/user_install.html
Run Code Online (Sandbox Code Playgroud)
知道为什么吗?尝试了建议的解决方案。
我有这个输出:
[Pandas-profiling] ImportError:无法从“pandas.core.dtypes.generic”导入名称“ABCIndexClass”
当尝试以这种方式导入 pandas-profiling 时:
from pandas_profiling import ProfileReport
Run Code Online (Sandbox Code Playgroud)
它似乎正确导入了 pandas-profiling,但在与 pandas 本身交互时却遇到了困难。这两个库目前都是通过 conda 进行更新的。根据他们的文档,它似乎与 pandas-profiling 相关的任何常见问题都不匹配,而且我似乎无法找到导入 name 的更通用的解决方案ABCIndexClass。
谢谢
我今天刚刚将Python升级到3.11。Pandas-profiling 以前工作正常,但现在由于以下错误,我似乎无法导入它:
cannot import name 'DataError' from 'pandas.core.base' (C:\Users\User_name\AppData\Local\Programs\Python\Python311\Lib\site-packages\pandas\core\base.py)
Run Code Online (Sandbox Code Playgroud)
关于如何解决这个问题有什么帮助吗?
这是我的代码:
import pandas as pd
from pandas_profiling import ProfileReport
Run Code Online (Sandbox Code Playgroud)
Pandas 版本 - 1.5.2 Pandas-profiling 版本 - 3.2.0
数据并不完全干净,但在使用熊猫时没有问题。pandas 库为 EDA 提供了许多非常有用的函数。
但是,当我对大数据(即 10 亿条记录和 10 列)使用分析时,从数据库表中读取它时,它没有完成并且我的笔记本电脑内存不足,csv 中的数据大小约为 6 GB,我的 RAM 为 14 GB 我的空闲使用量大约是 3 - 4 GB。
df = pd.read_sql_query("select * from table", conn_params)
profile = pandas.profiling.ProfileReport(df)
profile.to_file(outputfile="myoutput.html")
Run Code Online (Sandbox Code Playgroud)
我也尝试过使用check_recoded = False选项。但这对完全分析没有帮助。有什么办法可以对数据进行分块读取,最终生成一个整体的汇总报告?或任何其他方法将此函数用于大型数据集。
使用熊猫分析生成报告。数据集的大小非常大,以加快处理速度,试图关闭相关性,因此我使用了另一篇我看到的Check_correlations,ValueError:配置参数“ check_correlation”不存在。那是我从使用此行得到的问题
a = prof.ProfileReport(df, title='EXTRACTS', check_correlation=False)
Run Code Online (Sandbox Code Playgroud)
产生这个问题
ValueError:配置参数“ check_correlation”不存在。
我正在尝试在 conda Jupyter NB 中运行 EDA 的配置文件报告,但不断收到错误消息。
到目前为止,这是我的代码:
import pandas_profiling
from pandas_profiling import ProfileReport
profile = ProfileReport(data)
Run Code Online (Sandbox Code Playgroud)
和
profile = pandas_profiling.ProfileReport(data)
Run Code Online (Sandbox Code Playgroud)
两者都产生:
类型错误:concat() 得到了一个意外的关键字参数“join_axes”
研究建议升级到我正在使用的 Pandas 1.0。
也试过
data.profile_report()
Run Code Online (Sandbox Code Playgroud)
AttributeError: 'DataFrame' 对象没有属性 'profile_report'
关于我哪里出错的任何提示?
附录……所以我终于想通了。需要在 conda 中安装最新版本的 pandas-profiling,即 202003 版本。太容易了。
我从 kaggle 下载了泰坦尼克号数据集。我正在通过安装 pandas_profiling 来实现 pandas 的分析
我们将不胜感激您的贡献!
import pandas as pd
df = pd.read_csv('E:/pythonWorkspace/excelFiles/train.csv')
df.head()
from pandas_profiling import ProfileReport
prof = ProfileReport(df) #object created!
prof.to_file(output_file='output.html')
Run Code Online (Sandbox Code Playgroud)
错误 :
PydanticImportError: `BaseSettings` has been moved to the `pydantic-settings` package. See https://docs.pydantic.dev/2.0.2/migration/#basesettings-has-moved-to-pydantic-settings for more details.
For further information visit https://errors.pydantic.dev/2.0.2/u/import-error
Run Code Online (Sandbox Code Playgroud) 我正在尝试导入熊猫分析。
import pandas as pd
!pip install pandas_profiling
import pandas_profiling as pp
但是,有一条错误消息说无法从“pandas_profiling.report”导入名称“to_html”
我是 pandas_profiling 的新手,并且在导入时遇到了 ImportError。请帮忙。
import numpy as np
import pandas as pd
import pandas_profiling
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
%matplotlib inline
import seaborn as sns
Run Code Online (Sandbox Code Playgroud)
在 jupyter notebook 中执行上述代码后,出现以下错误。
ImportError:选择默认后端“Matplotlib”时,需要Matplotlib。
> python --version
Python 3.7.3
> 点子列表 | grep -E "matplotlib|pandas"
matplotlib 3.2.0
熊猫 0.25.3
熊猫分析 2.5.3
pandas-profiling ×10
pandas ×9
python ×7
python-3.x ×2
ipywidgets ×1
jupyter ×1
linux ×1
matplotlib ×1
profiling ×1