.map()我用python中的哪个函数labeledPoints从spark数据帧创建一组?如果标签/结果不是第一列,但我可以参考其列名"状态",那么表示法是什么?
我用这个.map()函数创建了Python数据帧:
def parsePoint(line):
listmp = list(line.split('\t'))
dataframe = pd.DataFrame(pd.get_dummies(listmp[1:]).sum()).transpose()
dataframe.insert(0, 'status', dataframe['accepted'])
if 'NULL' in dataframe.columns:
dataframe = dataframe.drop('NULL', axis=1)
if '' in dataframe.columns:
dataframe = dataframe.drop('', axis=1)
if 'rejected' in dataframe.columns:
dataframe = dataframe.drop('rejected', axis=1)
if 'accepted' in dataframe.columns:
dataframe = dataframe.drop('accepted', axis=1)
return dataframe
Run Code Online (Sandbox Code Playgroud)
在reduce函数重新组合了所有Pandas数据帧之后,我将其转换为Spark数据帧.
parsedData=sqlContext.createDataFrame(parsedData)
Run Code Online (Sandbox Code Playgroud)
但是现在我如何labledPoints用Python 创建呢?我想它可能是另一个.map()功能?
python pandas apache-spark apache-spark-ml apache-spark-mllib
在AWS集群上运行spark作业时,我相信我已正确更改了代码,以分发数据和我正在使用的算法的工作.但输出看起来像这样:
[Stage 3:> (0 + 2) / 1000]
[Stage 3:> (1 + 2) / 1000]
[Stage 3:> (2 + 2) / 1000]
[Stage 3:> (3 + 2) / 1000]
[Stage 3:> (4 + 2) / 1000]
[Stage 3:> (5 + 2) / 1000]
[Stage 3:> (6 + 2) / 1000]
[Stage 3:> (7 + 2) / 1000]
[Stage 3:> (8 + 2) / 1000]
[Stage 3:> (9 + 2) / 1000]
[Stage 3:> (10 + 2) / 1000]
[Stage 3:> …Run Code Online (Sandbox Code Playgroud) 我有一个数据库,我用来填充列表视图.在此列表视图上方有一个edittext,用户在列表视图中搜索项目.基于输入,我希望对列表视图进行细化和过滤,以仅包含与输入类似的项目.这在java中是直截了当的,但在xamarin中很难用于android.这是我的onCreate()方法,其中数据库填充listview.
string[] categories;
protected override void OnCreate (Bundle bundle)
{
base.OnCreate (bundle);
SetContentView(Resource.Layout.b);
var destPath = Path.Combine(System.Environment.GetFolderPath(System.Environment.SpecialFolder.Personal), "DDxDDB");
System.IO.Stream source = Assets.Open("DDxDDB");
var dest = System.IO.File.Create (destPath);
source.CopyTo (dest);
var sql = "SELECT _id FROM Sx;";
var conn = new SqliteConnection ("Data Source=" + destPath.ToString());
conn.Open ();
var cmd = conn.CreateCommand ();
cmd.CommandText = sql;
SqliteDataReader reader = cmd.ExecuteReader ();
List<string> categ = new List<string>();
while (reader.Read())
{
categ.Add(reader.GetString(0));
}
categories = categ.ToArray();
ArrayAdapter<string> dataAdapter = new ArrayAdapter<String>(this, Resource.Layout.Main, categories); …Run Code Online (Sandbox Code Playgroud)