Blu*_*eet 5 apache-spark h2o spark-dataframe
我已经阅读了H2O.ai的PythonBooklet.pdf和python API文档,但仍然找不到干净的方法来做到这一点.我知道我可以做以下任何一种情况:
flatMap+ collect或collect+列表推导.get_frame_data,它给我一串标题和数据分隔\n; 然后将其转换为列表(在我的情况下为数字列表).有一个更好的方法吗?谢谢.
小智 6
您可以尝试这样的事情:通过调用.as_data_frame()将H2OFrame作为pandas数据帧引入python,然后在感兴趣的列上调用.tolist().
一个自包含的例子w/iris
import h2o
h2o.init()
df = h2o.import_file("iris_wheader.csv")
pd = df.as_data_frame()
pd['sepal_len'].tolist()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
4176 次 |
| 最近记录: |