Les*_*ley 6 machine-learning graphlab sframe
因此,一周前我开始使用 Graphlab 来参加我的机器学习课程。我对 Graphlab 还很陌生,我通读了 API,但无法完全得到我正在寻找的解决方案。那么,问题来了。我有多个列的数据,例如卧室、浴室、平方英尺、邮政编码等。这些基本上是特征,我的目标是使用各种机器学习算法来预测房屋的价格。现在,我应该找到邮政编码为 93038 的房屋的平均价格。因此,我将问题分解为更小的部分,因为我很天真,决定利用我的直觉。这是我到目前为止所尝试的。首先,我试图找到一种方法来创建一个过滤器,这样我就可以只提取邮政编码为 93038 的房屋的价格。
import graphlab
sf = graphlab.SFrame('home_data.gl')
sf[(sf['zipcode']=='93038')]
Run Code Online (Sandbox Code Playgroud)
这些向我显示了邮政编码 93038 的所有列,但后来我只想显示价值 93038 的价格和邮政编码列。我尝试了很多不同的方法,但就是无法弄清楚。
另外,假设我想找到邮政编码值为 93038 的价格平均值。我该怎么做?
提前致谢。
你可以尝试:
import graphlab as gl
sf = gl.SFrame({'price':[1,4,2],'zipcode':['93038','93038','93037']})
# Filtering
filter_sf = sf[(sf['zipcode']=='93038')]
# Displaying
print filter_sf[['price', 'zipcode']]
# Averaging a column
print filter_sf['price'].mean()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5188 次 |
| 最近记录: |