我有一个具有大量功能的数据集,因此分析相关矩阵变得非常困难.我想绘制一个相关矩阵,我们可以使用dataframe.corr()pandas库中的函数.是否有任何内置函数由pandas库提供以绘制此矩阵?
python data-visualization matplotlib information-visualization pandas
我构建了一个结果的熊猫数据框.此数据框充当表.有MultiIndexed列,每行代表一个名称,即index=['name1','name2',...]创建DataFrame时.我想显示这个表并将其保存为png(或任何图形格式).目前,我能得到的最接近的是将其转换为html,但我想要一个png.看起来有类似的问题,如如何将Pandas数据帧/系列数据保存为数字?
但是,标记的解决方案将数据帧转换为线图(而不是表格),而另一个解决方案依赖于PySide,我只想因为无法将其安装在Linux上而远离它.我希望这段代码易于移植.我真的希望使用python可以轻松创建表格.所有帮助表示赞赏.
这听起来有点奇怪,但我需要将Pandas控制台输出字符串保存到png图片.例如:
>>> df
sales net_pft ROE ROIC
STK_ID RPT_Date
600809 20120331 22.1401 4.9253 0.1651 0.6656
20120630 38.1565 7.8684 0.2567 1.0385
20120930 52.5098 12.4338 0.3587 1.2867
20121231 64.7876 13.2731 0.3736 1.2205
20130331 27.9517 7.5182 0.1745 0.3723
20130630 40.6460 9.8572 0.2560 0.4290
20130930 53.0501 11.8605 0.2927 0.4369
Run Code Online (Sandbox Code Playgroud)
有没有什么方法df.output_as_png(filename='df_data.png')可以生成一个只显示上面内容的图片文件?
我已经设计了数据帧输出的样式,并让它在 Jupyter Notebook 中显示我想要的方式,但我遇到问题,找不到一种将其保存为图像的好方法。我已经尝试过https://pypi.org/project/dataframe-image/但我的工作方式似乎是 NoneType 因为它是一个样式器对象,并且在尝试使用此库时出错。
这只是整个代码的一个片段,旨在循环几个“col_names”,我想将它们保存为图像(以解释一些编码)。
import pandas as pd
import numpy as np
col_name = 'TestColumn'
temp_df = pd.DataFrame({'TestColumn':['A','B','A',np.nan]})
t1 = (temp_df[col_name].fillna("Unknown").value_counts()/len(temp_df)*100).to_frame().reset_index()
t1.rename(columns={'index':' '}, inplace=True)
t1[' '] = t1[' '].astype(str)
display(t1.style.bar(subset=[col_name], color='#5e81f2', vmax=100, vmin=0).set_table_attributes('style="font-size: 17px"').set_properties(
**{'color': 'black !important',
'border': '1px black solid !important'}
).set_table_styles([{
'selector': 'th',
'props': [('border', '1px black solid !important')]
}]).set_properties( **{'width': '500px'}).hide_index().set_properties(subset=[" "], **{'text-align': 'left'}))
Run Code Online (Sandbox Code Playgroud)