小编use*_*003的帖子

在Python中使用Spark DataFrame创建labeledPoints

.map()我用python中的哪个函数labeledPoints从spark数据帧创建一组?如果标签/结果不是第一列,但我可以参考其列名"状态",那么表示法是什么?

我用这个.map()函数创建了Python数据帧:

def parsePoint(line):
    listmp = list(line.split('\t'))
    dataframe = pd.DataFrame(pd.get_dummies(listmp[1:]).sum()).transpose()
    dataframe.insert(0, 'status', dataframe['accepted'])
    if 'NULL' in dataframe.columns:
        dataframe = dataframe.drop('NULL', axis=1)  
    if '' in dataframe.columns:
        dataframe = dataframe.drop('', axis=1)  
    if 'rejected' in dataframe.columns:
        dataframe = dataframe.drop('rejected', axis=1)  
    if 'accepted' in dataframe.columns:
        dataframe = dataframe.drop('accepted', axis=1)  
    return dataframe 
Run Code Online (Sandbox Code Playgroud)

在reduce函数重新组合了所有Pandas数据帧之后,我将其转换为Spark数据帧.

parsedData=sqlContext.createDataFrame(parsedData)
Run Code Online (Sandbox Code Playgroud)

但是现在我如何labledPoints用Python 创建呢?我想它可能是另一个.map()功能?

python pandas apache-spark apache-spark-ml apache-spark-mllib

11
推荐指数
1
解决办法
1万
查看次数

解释Spark阶段输出日志

在AWS集群上运行spark作业时,我相信我已正确更改了代码,以分发数据和我正在使用的算法的工作.但输出看起来像这样:

[Stage 3:>                                                       (0 + 2) / 1000]
[Stage 3:>                                                       (1 + 2) / 1000]
[Stage 3:>                                                       (2 + 2) / 1000]
[Stage 3:>                                                       (3 + 2) / 1000]
[Stage 3:>                                                       (4 + 2) / 1000]
[Stage 3:>                                                       (5 + 2) / 1000]
[Stage 3:>                                                       (6 + 2) / 1000]
[Stage 3:>                                                       (7 + 2) / 1000]
[Stage 3:>                                                       (8 + 2) / 1000]
[Stage 3:>                                                       (9 + 2) / 1000]
[Stage 3:>                                                      (10 + 2) / 1000]
[Stage 3:> …
Run Code Online (Sandbox Code Playgroud)

stage task apache-spark

5
推荐指数
1
解决办法
2756
查看次数

单声道的AddTextChangedListener for android

我有一个数据库,我用来填充列表视图.在此列表视图上方有一个edittext,用户在列表视图中搜索项目.基于输入,我希望对列表视图进行细化和过滤,以仅包含与输入类似的项目.这在java中是直截了当的,但在xamarin中很难用于android.这是我的onCreate()方法,其中数据库填充listview.

string[] categories;
protected override void OnCreate (Bundle bundle)
{
    base.OnCreate (bundle);
    SetContentView(Resource.Layout.b);
    var destPath = Path.Combine(System.Environment.GetFolderPath(System.Environment.SpecialFolder.Personal), "DDxDDB"); 
    System.IO.Stream source = Assets.Open("DDxDDB");
    var dest = System.IO.File.Create (destPath);
    source.CopyTo (dest); 
    var sql = "SELECT _id FROM Sx;";
    var conn = new SqliteConnection ("Data Source=" + destPath.ToString());
    conn.Open ();
    var cmd = conn.CreateCommand ();
    cmd.CommandText = sql;
    SqliteDataReader reader = cmd.ExecuteReader ();
    List<string> categ = new List<string>();
    while (reader.Read()) 
    {
        categ.Add(reader.GetString(0));
    }
    categories = categ.ToArray();
    ArrayAdapter<string> dataAdapter = new ArrayAdapter<String>(this, Resource.Layout.Main, categories); …
Run Code Online (Sandbox Code Playgroud)

listview filtering xamarin.android textchanged

1
推荐指数
1
解决办法
5031
查看次数