Rom*_*man 87 python plot matplotlib dataframe pandas
我有一个pandas数据框,并希望绘制一列中的值与另一列中的值.幸运的是,有plot
一种与数据帧相关的方法似乎可以满足我的需求:
df.plot(x='col_name_1', y='col_name_2')
Run Code Online (Sandbox Code Playgroud)
不幸的是,它看起来像打印样式(上市中这里后kind
参数)有没有点.我可以使用线条或条纹甚至密度但不能使用点数.有没有可以帮助解决这个问题的解决方法.
sod*_*odd 98
您可以style
在调用时指定绘制的行df.plot
:
df.plot(x='col_name_1', y='col_name_2', style='o')
Run Code Online (Sandbox Code Playgroud)
该style
参数也可以是一个dict
或者list
,如:
import numpy as np
import pandas as pd
d = {'one' : np.random.rand(10),
'two' : np.random.rand(10)}
df = pd.DataFrame(d)
df.plot(style=['o','rx'])
Run Code Online (Sandbox Code Playgroud)
所有可接受的样式格式都列在文档中matplotlib.pyplot.plot
.
ely*_*ely 72
对于这个(以及大多数绘图),我不会依赖于Pandas包装器到matplotlib.相反,只需直接使用matplotlib:
import matplotlib.pyplot as plt
plt.scatter(df['col_name_1'], df['col_name_2'])
plt.show() # Depending on whether you use IPython or interactive mode, etc.
Run Code Online (Sandbox Code Playgroud)
并记住,例如,您可以访问列的值的NumPy数组df.col_name_1.values
.
我在使用Pandas默认绘图时遇到了麻烦,对于一列具有毫秒精度的Timestamp值.在尝试将对象转换为datetime64
类型时,我还发现了一个令人讨厌的问题:< Pandas在询问Timestamp列值是否具有attr astype > 时给出了错误的结果.
Pandas
使用matplotlib
作为基本的绘图库。在您的情况下,最简单的方法将使用以下内容:
import pandas as pd
import numpy as np
#creating sample data
sample_data={'col_name_1':np.random.rand(20),
'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
df.plot(x='col_name_1', y='col_name_2', style='o')
Run Code Online (Sandbox Code Playgroud)
但是,seaborn
如果您想要更多自定义图而不进入基本级别,我建议将其用作替代解决方案matplotlib.
在这种情况下,您的解决方案将如下:
import pandas as pd
import seaborn as sns
import numpy as np
#creating sample data
sample_data={'col_name_1':np.random.rand(20),
'col_name_2': np.random.rand(20)}
df= pd.DataFrame(sample_data)
sns.scatterplot(x="col_name_1", y="col_name_2", data=df)
Run Code Online (Sandbox Code Playgroud)