标签: apache-zeppelin

在后面的段落中是否可以在%jdbc段中返回数据?

如果段落从%jdbc intepreter返回数据,那么该数据是否可用于以下使用其他解释器的段落?

例如

 %jdbc(psql)
 select * from `table`
Run Code Online (Sandbox Code Playgroud)

然后

 %python
 # load / access data here
 x = ...
Run Code Online (Sandbox Code Playgroud)

与%spark解释器可以创建时态表的方式相同,以下段落可以运行%sql.

apache-zeppelin

9
推荐指数
1
解决办法
1741
查看次数

Zeppelin更改了Spark Master已在使用的端口

当我在AWS上启动zeppelin时,它从端口8080开始,但是有Spark Master所以它说端口已经在使用...我尝试在配置文件中更改zeppelin中的端口,在"zeppelin-site.xml.template"中

<property>
  <name>zeppelin.server.port</name>
  <value>8050</value>
  <description>Server port.</description>
</property>
Run Code Online (Sandbox Code Playgroud)

我也在"zeppelin-env.sh.template"中添加了同一端口的env行.

当我启动zeppelin时,我会好的,但是如果我看到开放端口,它在任何地方都没有出现8050,所以看起来它仍然试图在端口8080上部署,其中Spark Master是......

得到齐柏林飞艇的人不会忽视变化的港口?

谢谢

apache-spark apache-zeppelin

8
推荐指数
2
解决办法
1万
查看次数

Apache zeppelin教程,错误"未找到sql解释器"

在" Zeppelin教程 "笔记本中,我无法使用%sql解释器.它将输出" sql interpreter not found".但是火花命令做工精细,以及%md%sh.

这是日志:

错误[2015-10-20 10:13:35,045]({qtp885851948-51} NotebookServer.java [runParagraph]:615) - 运行异常org.apache.zeppelin.interpreter.InterpreterException:在org.apache中找不到sql解释器.zeppelin.notebook.NoteInterpreterLoader.get(NoteInterpreterLoader.java:148)org.apache.zeppelin.notebook.Note.run(Note.java:282)org.apache.zeppelin.socket.NotebookServer.runParagraph(NotebookServer.java) :613)org.apache.zeppelin.socket.NotebookServer.onMessage(NotebookServer.java:126)位于org.eclipse.jetty.websocket的org.apache.zeppelin.socket.NotebookSocket.onMessage(NotebookSocket.java:56). WebSocketConnectionRFC6455 $ WSFrameHandler.onFrame(WebSocketConnectionRFC6455.java:835)位于org.eclipse.jetty.websocket.WebSocketParserRFC6455.parseNext(WebSocketParserRFC6455.java:349)atg.eclipse.jetty上的org.eclipse.jetty.webocket.WebSocketConnectionRFC6455.handle(WebSocketConnectionRFC6455.java:225)org.eclipse.jetty.nle.SelectChannelEndPoint.handle(SelectChannelEndPoint.java:667) .io.nio.SelectChannelEndPoint $ 1.run(SelectChannelEndPoint.java:52)atg.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)org.eclipse.jetty.util.thread.QueuedThreadPool $ 3 .run(QueuedThreadPool.java:543)在java.lang.Thread.run(Thread.java:745)java:52)org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)at org.eclipse.jetty.util.thread.QueuedThreadPool $ 3.run(QueuedThreadPool.java:543)at java. lang.Thread.run(Thread.java:745)java:52)org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)at org.eclipse.jetty.util.thread.QueuedThreadPool $ 3.run(QueuedThreadPool.java:543)at java. lang.Thread.run(Thread.java:745)

apache-spark-sql apache-zeppelin

8
推荐指数
1
解决办法
8896
查看次数

Apache - Zeppelin跨段使用变量

我试图在Apache Zeppelin上完成以下用例:例如,当我编写一个sql查询时

%sql SELECT * FROM table1 WHERE column1 = ${column1=1,1|2|3|4}
Run Code Online (Sandbox Code Playgroud)

我得到一个组合框,显示这些值(1,2,3,4)作为选项.我想要做的是使用此列可用的所有不同值填充此列表(或者事实上,我可能希望从变量形式的另一段中获取任何其他值集).所以目前我仍然坚持如何在另一段中的sql语句中使用一个段落中定义的变量?

潜入代码,我看到在Zeppelin解释器中,一个名为Input.java的文件检查模式$ {someColumn = someValues},填充组合框选项,然后创建一个简单的查询,因此我已经删除通过在同一段落中运行查询来填充它的想法.

sql data-analysis apache-zeppelin

8
推荐指数
1
解决办法
3332
查看次数

带有sparkr的zeppelin不会将数据帧显示为表

zeppelin R解释器文档说明:

If you return a data.frame, Zeppelin will attempt to display it using Zeppelin's built-in visualizations.
Run Code Online (Sandbox Code Playgroud)

这可以在文档示例中看到:

在此输入图像描述

但是,当我尝试从我的zeppelin 0.6.0笔记本运行相同的R命令时,我看到以下内容:

在此输入图像描述

知道为什么我没有看到表格输出吗?

apache-zeppelin sparkr

8
推荐指数
1
解决办法
986
查看次数

如何在齐柏林飞艇上添加一个罐子?

如何在Zeppelin中为%hive解释器添加一个jar?

我试过了

%z.dep('');
add jar <jar path>
Run Code Online (Sandbox Code Playgroud)

此外,zeppelin hive解释器抛出ClassNotFoundException

./interpreter/hive/add jar说找不到文件的同时添加了通过 thrift异常.

怎么做?我试图通过亚马逊添加jsonserde.jar来解析DynamoDB导入.

json hive jar amazon-emr apache-zeppelin

8
推荐指数
2
解决办法
1万
查看次数

Spark抛出java.util.NoSuchElementException:未找到密钥:67

在Zeppelin中运行Spark bisecting kmmeans算法.

//I transform my data using the TF-IDF algorithm 

val idf = new IDF(minFreq).fit(data)
val hashIDF_features = idf.transform(dbTF)    

//and parse the transformed data to the clustering algorithm.

val bkm = new BisectingKMeans().setK(100).setMaxIterations(2)
val model = bkm.run(hashIDF_features)
val cluster_rdd = model.predict(hashIDF_features)
Run Code Online (Sandbox Code Playgroud)

我总是得到这个错误:

org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 270.0 failed 4 times, most recent failure: Lost task 0.3 in stage 270.0 (TID 126885, IP): java.util.NoSuchElementException: key not found: 67
    at scala.collection.MapLike$class.default(MapLike.scala:228)
    at scala.collection.AbstractMap.default(Map.scala:58)
    at …
Run Code Online (Sandbox Code Playgroud)

scala nosuchelementexception apache-spark apache-zeppelin

8
推荐指数
1
解决办法
1万
查看次数

Zeppelin Notebook的键盘快捷键

键盘快捷键有一个旧的jira.但似乎没有相关文件

https://issues.apache.org/jira/browse/ZEPPELIN-391

快捷方式是否有全面的备忘单?特别是与优秀的jupyter键盘快捷键相比; 例如,dd删除一个单元格.

keyboard-shortcuts apache-zeppelin

8
推荐指数
2
解决办法
9904
查看次数

Apache Zeppelin - 如何在Apache Zeppelin中使用Helium框架

从Zeppelin-0.7开始,Zeppelin开始使用Helium Framework支持Helium插件/软件包.但是,我无法在Helium页面上查看任何插件(localhost:8080 /#/ helium).根据这个JIRA,我在/ local-repo/helium-registry-cache下放置了样本Helium.json(在s3上可用).但是,之后我在重启Apache Zeppelin服务时获得了NPE.

我尝试过Zeppelin 0.7以及Zeppelin 0.8.0 snaptshot版本.特别是,我想在Zeppelin笔记中使用地图Helium包 - Helium-Map.

有人可以向我指出在Zeppelin中使用Helium包的详细步骤的任何指南或文档吗?任何帮助将不胜感激!

apache apache-zeppelin

8
推荐指数
1
解决办法
3783
查看次数

使用zeppelin在csv中导出数据

我需要从zeppelin中的%sql解释器导出csv格式的数据.我怎么能这样做?我需要添加一个按钮并点击它,它应该导出csv中的数据,如客户端的sql解释器中的zeppelin中的图形所示.

apache-zeppelin

7
推荐指数
1
解决办法
7603
查看次数