Seaborn load_dataset

Ars*_*alt 44 python boxplot seaborn

我试图使用Seaborn按照示例获得分组的boxplot

我可以让上面的例子工作,但行:

tips = sns.load_dataset("tips")
Run Code Online (Sandbox Code Playgroud)

根本没有解释.我找到了tips.csv文件,但我似乎无法找到有关load_dataset具体做什么的充分文档.我试图创建自己的csv并加载它,但无济于事.我还重命名了提示文件,它仍然有效...

我的问题是:

load_dataset实际上在哪里寻找文件?我可以将它用于我自己的箱形图吗?

编辑:我设法让我自己的箱形图使用我自己的DataFrame,但我仍然想知道是否load_dataset用于除了神秘的教程示例之外的任何东西.

sel*_*yth 54

load_datasethttps://github.com/mwaskom/seaborn-data上查找在线csv文件.这是docstring:

从在线存储库加载数据集(需要互联网).

参数


name:str数据集的名称(https://github.com/mwaskom/seaborn-data上的name .csv ).您可以使用以下命令获取可用数据集列表:func:get_dataset_names

kws:dict,可选传递给pandas.read_csv

如果要修改该在线数据集或引入自己的数据,则可能必须使用pandas.load_dataset实际上返回一个pandas DataFrame对象,你可以确认type(tips).

如果您已经在名为tips2.csv的csv文件中创建了自己的数据,并将其保存在与脚本相同的位置,请使用此方法(在安装pandas之后)将其加载到:

import pandas as pd

tips2 = pd.read_csv('tips2.csv')
Run Code Online (Sandbox Code Playgroud)


Sah*_*pal 8

只是为了添加到“selwyth”的答案中。

import pandas as pd
Data=pd.read_csv('Path\to\csv\')
Data.head(10)
Run Code Online (Sandbox Code Playgroud)

成功完成这些步骤后。现在绘图实际上是这样工作的。

假设您想绘制条形图。

sns.barplot(x=Data.Year,y=Data.Salary) //year and salary attributes were present in my dataset.
Run Code Online (Sandbox Code Playgroud)

这实际上适用于 seaborn 中的每个绘图。

此外,我们将没有资格在 Seaborn Git 上添加我们自己的数据集。