san*_*eep 10 java cassandra datastax apache-spark
这是我想要做的.
我创建了两个DataStax企业集群节点,在此基础上我创建了一个java程序来获取一个表的计数(Cassandra数据库表).
这个程序是在eclipse中构建的,实际上是从一个Windows框中.
在从Windows运行此程序时,它在运行时失败并出现以下错误:
初始工作没有接受任何资源; 检查群集UI以确保工作人员已注册并具有足够的内存
已经在这些集群上成功编译和运行相同的代码而没有任何问题.可能是什么原因导致错误?
码:
import org.apache.spark.SparkConf;
import org.apache.spark.SparkContext;
import org.apache.spark.api.java.JavaSparkContext;
import org.apache.spark.sql.SchemaRDD;
import org.apache.spark.sql.cassandra.CassandraSQLContext;
import com.datastax.bdp.spark.DseSparkConfHelper;
public class SparkProject {
public static void main(String[] args) {
SparkConf conf = DseSparkConfHelper.enrichSparkConf(new SparkConf()).setMaster("spark://10.63.24.14X:7077").setAppName("DatastaxTests").set("spark.cassandra.connection.host","10.63.24.14x").set("spark.executor.memory", "2048m").set("spark.driver.memory", "1024m").set("spark.local.ip","10.63.24.14X");
JavaSparkContext sc = new JavaSparkContext(conf);
CassandraSQLContext cassandraContext = new CassandraSQLContext(sc.sc());
SchemaRDD employees = cassandraContext.sql("SELECT * FROM portware_ants.orders");
//employees.registerTempTable("employees");
//SchemaRDD managers = cassandraContext.sql("SELECT symbol FROM employees");
System.out.println(employees.count());
sc.stop();
}
}
Run Code Online (Sandbox Code Playgroud)
ame*_*amm 19
我遇到了类似的问题,经过一些在线研究和试验错误之后,我缩小了3个原因(除了第一个,其他两个甚至没有接近错误信息):
我的问题是我分配的内存比我的奴隶可用的内存多.尝试减少spark提交的内存大小.类似于以下内容:
~/spark-1.5.0/bin/spark-submit --master spark://my-pc:7077 --total-executor-cores 2 --executor-memory 512m
Run Code Online (Sandbox Code Playgroud)
我的~/spark-1.5.0/conf/spark-env.sh存在:
SPARK_WORKER_INSTANCES=4
SPARK_WORKER_MEMORY=1000m
SPARK_WORKER_CORES=2
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
16636 次 |
| 最近记录: |