如何将H2OFrame中的列转换为python列表?

Blu*_*eet 5 apache-spark h2o spark-dataframe

我已经阅读了H2O.ai的PythonBooklet.pdf和python API文档,但仍然找不到干净的方法来做到这一点.我知道我可以做以下任何一种情况:

  • 将H2OFrame转换为Spark DataFrame并执行flatMap+ collectcollect+列表推导.
  • 使用H2O get_frame_data,它给我一串标题和数据分隔\n; 然后将其转换为列表(在我的情况下为数字列表).

有一个更好的方法吗?谢谢.

小智 6

您可以尝试这样的事情:通过调用.as_data_frame()将H2OFrame作为pandas数据帧引入python,然后在感兴趣的列上调用.tolist().

一个自包含的例子w/iris

import h2o
h2o.init()
df = h2o.import_file("iris_wheader.csv")
pd = df.as_data_frame()
pd['sepal_len'].tolist()
Run Code Online (Sandbox Code Playgroud)