Kelper在打开包含大量文件的文件夹方面明显更快(平均约200个文件).另一方面,Luna将旋转约10秒钟打开每个文件夹.我已经堆积并重新克隆我的工作区,以便不使用任何旧的eclipse属性.我认为这解决了它没有的问题.有没有人有任何其他想法(最小堆大小1024,最大2048),ram不是问题或处理包?
我正在尝试找到一个使用List [Column进行spark选择的好方法,我正在爆炸一个列,而不是使用我的爆炸列传回我感兴趣的所有列.
var columns = getColumns(x) // Returns a List[Column]
tempDf.select(columns) //trying to get
Run Code Online (Sandbox Code Playgroud)
试着找到一个好方法,我知道,如果它是一个字符串,我可以做类似的事情
val result = dataframe.select(columnNames.head, columnNames.tail: _*)
Run Code Online (Sandbox Code Playgroud) 学习Python时,我在制作链表类时遇到了一些问题.这只是一个快速节点和脏节点类.在java中我会关闭私有Node next和private int val但我只知道global是python cousin.这看起来怎么样?
#class Node class
class Node(object):
global next
global val
def __init__(self):
next
val
def setNext(self, aNext):
self.next = aNext
def getNext(self):
return self.next
def setVal(self, aVal):
self.val = aVal
def getVal(self):
return self.val
Run Code Online (Sandbox Code Playgroud)
然后我尝试在另一个类中使用Node
from Node import *
head = Node()
Run Code Online (Sandbox Code Playgroud)
我怎么会得到一个未定义变量的错误.抱歉,这是一个简单的问题,只是python的新功能.感谢帮助.