小编Pa *_* Rö的帖子

Spark vs Flink内存不足

我已经构建了Spark和Flink k-means应用程序.我的测试用例是在3节点集群上对100万个点进行聚类.

当内存中的瓶颈开始时,Flink开始外包到磁盘并且工作缓慢但工作正常.但是,如果内存已满并且再次启动(无限循环?),Spark会丢失执行程序.

我试着在邮件列表的帮助下自定义内存设置,谢谢.但Spark仍然无效.

是否有必要设置任何配置?我的意思是Flink工作的内存很低,Spark也必须能够; 或不?

memory apache-spark apache-flink

14
推荐指数
1
解决办法
2384
查看次数

apache spark:带有所有依赖项的build jar的akka​​版本错误

我已经使用maven(mvn clean compile assembly:single)和以下pom文件从我的spark应用程序构建了一个jar文件:

<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
  xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
  <modelVersion>4.0.0</modelVersion>

  <groupId>mgm.tp.bigdata</groupId>
  <artifactId>ma-spark</artifactId>
  <version>0.0.1-SNAPSHOT</version>
  <packaging>jar</packaging>

  <name>ma-spark</name>
  <url>http://maven.apache.org</url>

  <properties>
    <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
  </properties>

  <repositories>
    <repository>
      <id>cloudera</id>
      <url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
    </repository>
  </repositories>

  <dependencies>
    <dependency>
      <groupId>junit</groupId>
      <artifactId>junit</artifactId>
      <version>3.8.1</version>
      <scope>test</scope>
    </dependency>
    <dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-core_2.10</artifactId>
        <version>1.1.0-cdh5.2.5</version>
    </dependency>
    <dependency>
        <groupId>mgm.tp.bigdata</groupId>
        <artifactId>ma-commons</artifactId>
        <version>0.0.1-SNAPSHOT</version>
    </dependency>
  </dependencies>

  <build>
  <plugins>
    <plugin>
      <artifactId>maven-assembly-plugin</artifactId>
      <configuration>
        <archive>
          <manifest>
            <mainClass>mgm.tp.bigdata.ma_spark.SparkMain</mainClass>
          </manifest>
        </archive>
        <descriptorRefs>
          <descriptorRef>jar-with-dependencies</descriptorRef>
        </descriptorRefs>
      </configuration>
    </plugin>
  </plugins>
</build>
</project>
Run Code Online (Sandbox Code Playgroud)

如果我在终端上使用java -jar ma-spark-0.0.1-SNAPSHOT-jar-with-dependencies.jar运行我的应用程序,我会收到以下错误消息:

VirtualBox:~/Schreibtisch$ java -jar ma-spark-0.0.1-SNAPSHOT-jar-with-dependencies.jar
2015-Jun-02 12:53:36,348 [main] org.apache.spark.util.Utils
 WARN  - Your hostname, proewer-VirtualBox resolves to a …
Run Code Online (Sandbox Code Playgroud)

java jar executable-jar maven apache-spark

7
推荐指数
2
解决办法
6588
查看次数

从平面缓冲区到字节数组的序列化和反序列化

你好 stackoverflow 社区:)

我想在java中创建一个flatbuffers对象,我可以将其序列化为字节数组,然后在java对象中反序列化。我第一次使用平面缓冲区,但无法初始化 java 对象。我的方法一步一步:

  1. 写一个方案
  2. 使用 flatbuffers 编译器将其编译为 java 类
  3. 从 github 导入 Flatbuffers 类
  4. 尝试构建一个java对象

这是我的第 4 步的代码:

FlatBufferBuilder fbb = new FlatBufferBuilder(1);
int str = fbb.createString("Dummy");
Monster.startPerson(fbb);
Monster.addName(fbb, str);
int p = Person.endPerson(fbb);
Run Code Online (Sandbox Code Playgroud)

也许有人可以发布一个简单的示例来创建 Flatbuffers 对象,以及如何序列化和反序列化字节数组?

希望得到答复并致以最诚挚的问候,

保罗

http://google.github.io/flatbuffers/

java serialization flatbuffers

4
推荐指数
1
解决办法
1万
查看次数