Sim*_*mon 4 python regression altair
我正在使用此示例https://altair-viz.github.io/user_guide/transform/regression.html 在 altair 中绘制回归趋势线。
import altair as alt
import pandas as pd
import numpy as np
np.random.seed(42)
x = np.linspace(0, 10)
y = x - 5 + np.random.randn(len(x))
df = pd.DataFrame({'x': x, 'y': y})
chart = alt.Chart(df).mark_point().encode(
x='x',
y='y'
)
chart + chart.transform_regression('x', 'y').mark_line()
Run Code Online (Sandbox Code Playgroud)
此外,我想将 rSquared 值作为文本添加到图表中。如何访问该值?根据文档,它应该是这样的:
chart + chart.transform_regression('x', 'y', params=True).mark_text()
Run Code Online (Sandbox Code Playgroud)
使用时,mark_text()您需要指定 x 和 y 位置(或编码)以及要显示的文本值的标签:
import altair as alt
import pandas as pd
import numpy as np
np.random.seed(42)
x = np.linspace(0, 10)
y = x - 5 + np.random.randn(len(x))
df = pd.DataFrame({'x': x, 'y': y})
chart = alt.Chart(df).mark_point().encode(
x='x',
y='y'
)
line = chart.transform_regression('x', 'y').mark_line()
params = alt.Chart(df).transform_regression(
'x', 'y', params=True
).mark_text(align='left').encode(
x=alt.value(20), # pixels from left
y=alt.value(20), # pixels from top
text='rSquared:N'
)
chart + line + params
Run Code Online (Sandbox Code Playgroud)
如果您还对以表格形式访问回归参数感兴趣,则可以使用包extract_data中的实验方法altair_transfrom。
import altair as alt
import pandas as pd
import numpy as np
import altair_transform
np.random.seed(42)
x = np.linspace(0, 10)
y = x - 5 + np.random.randn(len(x))
df = pd.DataFrame({'x': x, 'y': y})
chart = alt.Chart(df).mark_point().encode(
x='x',
y='y'
)
b = chart.transform_regression('x', 'y', params=True).mark_line()
print(altair_transform.extract_data(b))
# coef rSquared
# 0 [-4.935556907797029, 0.9420166005081777] 0.903174
Run Code Online (Sandbox Code Playgroud)
这是我在 git 上托管的 Altair 源存储库上创建的一个问题的交叉帖子。希望其他人发现这很有用。