我有一个带有单列的 Spark Dataframe,其中每一行都是一个长字符串(实际上是一个 xml 文件)。我想通过 DataFrame 并将每行中的一个字符串保存为文本文件,它们可以简单地称为 1.xml、2.xml 等。
我似乎找不到有关如何执行此操作的任何信息或示例。我刚刚开始使用 Spark 和 PySpark。也许在 DataFrame 上映射一个函数,但该函数必须将字符串写入文本文件,我找不到如何执行此操作。
我有一个二维矢量数组vector<vector<int> >,我需要按顺序对其中的向量进行排序.所以......我想我会编写一个比较两个向量然后使用的函数sort()
但是我无法理解,然后无法找到适当的语法.这是我的比较功能:
bool vectorcompare (vector<int> v, vector<int> w){
for(int i=0; i<v.size(); i++){
if(v[i]<w[i]) return 1;
if(v[i]>w[i]) return 0;
}
return 1;
}
Run Code Online (Sandbox Code Playgroud)
然后我调用sort函数,它不起作用:
sort(vector.begin(),vector.end(), vectorcompare());
Run Code Online (Sandbox Code Playgroud)
我做错了什么?