When plotting heatmaps with seaborn (and correlation matrices with matplotlib) the first and the last row is cut in halve. This happens also when I run this minimal code example which I found online.
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
data = pd.read_csv('https://raw.githubusercontent.com/resbaz/r-novice-gapminder-files/master/data/gapminder-FiveYearData.csv')
plt.figure(figsize=(10,5))
sns.heatmap(data.corr())
plt.show()
Run Code Online (Sandbox Code Playgroud)
The labels at the y axis are on the correct spot, but the rows aren't completely there.
A few days ago, it work as intended. Since then, I …
我正在从pandas pivot_table创建一个热图,如下所示:
table2 = pd.pivot_table(df,values='control',columns='Year',index='Region',aggfunc=np.sum)
sns.heatmap(table2,annot=True,cmap='Blues')
Run Code Online (Sandbox Code Playgroud)
它会创建一个热图,如下所示.你可以看到数字不是很大(最多750),但它用科学记数法显示它们.如果我查看表本身,情况并非如此.有关如何让它以简单的符号显示数字的任何想法?
我正在尝试使用seaborn(python)绘制ROC曲线.使用matplotlib我只需使用该函数plot
:
plt.plot(one_minus_specificity, sensitivity, 'bs--')
Run Code Online (Sandbox Code Playgroud)
where one_minus_specificity
和sensitivity
是两个配对值列表.
在seaborn中是否有简单的情节功能对应物?我看了一下画廊,但我没有找到任何简单的方法.
所以这是我的数据集的样子:
In [1]: df1=pd.DataFrame(np.random.rand(4,2),index=["A","B","C","D"],columns=["I","J"])
In [2]: df2=pd.DataFrame(np.random.rand(4,2),index=["A","B","C","D"],columns=["I","J"])
In [3]: df1
Out[3]:
I J
A 0.675616 0.177597
B 0.675693 0.598682
C 0.631376 0.598966
D 0.229858 0.378817
In [4]: df2
Out[4]:
I J
A 0.939620 0.984616
B 0.314818 0.456252
C 0.630907 0.656341
D 0.020994 0.538303
Run Code Online (Sandbox Code Playgroud)
我希望每个数据帧都有堆积条形图,但由于它们具有相同的索引,我希望每个索引有2个堆叠条形.
我试图在同一轴上绘制两个:
In [5]: ax = df1.plot(kind="bar", stacked=True)
In [5]: ax2 = df2.plot(kind="bar", stacked=True, ax = ax)
Run Code Online (Sandbox Code Playgroud)
但它重叠.
然后我尝试先连接两个数据集:
pd.concat(dict(df1 = df1, df2 = df2),axis = 1).plot(kind="bar", stacked=True)
Run Code Online (Sandbox Code Playgroud)
但这里一切都堆积如山
我最好的尝试是:
pd.concat(dict(df1 = df1, df2 = df2),axis = …
Run Code Online (Sandbox Code Playgroud) %pylab inline
import pandas as pd
import numpy as np
import matplotlib as mpl
import seaborn as sns
typessns = pd.DataFrame.from_csv('C:/data/testesns.csv', index_col=False, sep=';')
mpl.rc("figure", figsize=(45, 10))
sns.factorplot("MONTH", "VALUE", hue="REGION", data=typessns, kind="box", palette="OrRd");
Run Code Online (Sandbox Code Playgroud)
我总是得到一个小尺寸的数字,无论我在figsize指定的大小...如何解决它?
我正在Seaborn中绘制热图.问题是我的情节中有太多的正方形,所以x和y标签彼此太靠近才有用.所以我正在创建一个xticks和yticks列表来使用.但是,将此列表传递给函数会旋转图中的标签.让seaborn自动掉落一些蜱虫真的很不错,但是我希望能够让yticks直立起来.
import pandas as pd
import numpy as np
import seaborn as sns
data = pd.DataFrame(np.random.normal(size=40*40).reshape(40,40))
yticks = data.index
keptticks = yticks[::int(len(yticks)/10)]
yticks = ['' for y in yticks]
yticks[::int(len(yticks)/10)] = keptticks
xticks = data.columns
keptticks = xticks[::int(len(xticks)/10)]
xticks = ['' for y in xticks]
xticks[::int(len(xticks)/10)] = keptticks
sns.heatmap(data,linewidth=0,yticklabels=yticks,xticklabels=xticks)
Run Code Online (Sandbox Code Playgroud)
我试图使用Seaborn按照示例获得分组的boxplot
我可以让上面的例子工作,但行:
tips = sns.load_dataset("tips")
Run Code Online (Sandbox Code Playgroud)
根本没有解释.我找到了tips.csv文件,但我似乎无法找到有关load_dataset具体做什么的充分文档.我试图创建自己的csv并加载它,但无济于事.我还重命名了提示文件,它仍然有效...
我的问题是:
load_dataset
实际上在哪里寻找文件?我可以将它用于我自己的箱形图吗?
编辑:我设法让我自己的箱形图使用我自己的DataFrame
,但我仍然想知道是否load_dataset
用于除了神秘的教程示例之外的任何东西.
如果我使用Python中的seaborn库来绘制线性回归的结果,有没有办法找出回归的数值结果?例如,我可能想知道拟合系数或拟合的R 2.
我可以使用底层的statsmodels接口重新运行相同的拟合,但这似乎是不必要的重复工作,无论如何我想要能够比较结果系数,以确保数值结果与我的相同我在情节中看到了.
Seaborn提供了一个名为color_palette的功能,可以让您轻松地为绘图创建新的color_palettes.
colors = ["#67E568","#257F27","#08420D","#FFF000","#FFB62B","#E56124","#E53E30","#7F2353","#F911FF","#9F8CA6"]
color_palette = sns.color_palette(colors)
Run Code Online (Sandbox Code Playgroud)
我想将color_palette转换为cmap,我可以在matplotlib中使用,但我不知道如何做到这一点.
可悲的是,像"cubehelix_palette","light_palette"这样的函数,......有一个"as_cmap"参数.不幸的是,"color_palette"没有.