首先,我没有使用DSE Cassandra.我正在构建这个并使用Microsoft Azure来托管服务器.
我有一个2节点的Cassandra集群,我已经设法在单个节点上设置Spark,但我找不到任何关于在多节点集群上设置它的在线资源.
这不是如何设置spark Cassandra多节点集群的重复?
要在单个节点上进行设置,我已经按照本教程" 使用Cassandra Connector设置Spark "进行了操作.
我有一个数据集,其中类是不平衡的.这些课程要么是0,1要么是2.
我如何计算prediction error每个类,然后重新平衡weights相应地Sklearn.