如果段落从%jdbc intepreter返回数据,那么该数据是否可用于以下使用其他解释器的段落?
例如
%jdbc(psql)
select * from `table`
Run Code Online (Sandbox Code Playgroud)
然后
%python
# load / access data here
x = ...
Run Code Online (Sandbox Code Playgroud)
与%spark解释器可以创建时态表的方式相同,以下段落可以运行%sql.
当我在AWS上启动zeppelin时,它从端口8080开始,但是有Spark Master所以它说端口已经在使用...我尝试在配置文件中更改zeppelin中的端口,在"zeppelin-site.xml.template"中
<property>
<name>zeppelin.server.port</name>
<value>8050</value>
<description>Server port.</description>
</property>
Run Code Online (Sandbox Code Playgroud)
我也在"zeppelin-env.sh.template"中添加了同一端口的env行.
当我启动zeppelin时,我会好的,但是如果我看到开放端口,它在任何地方都没有出现8050,所以看起来它仍然试图在端口8080上部署,其中Spark Master是......
得到齐柏林飞艇的人不会忽视变化的港口?
谢谢
在" Zeppelin教程 "笔记本中,我无法使用%sql解释器.它将输出" sql interpreter not found".但是火花命令做工精细,以及%md和%sh.
这是日志:
错误[2015-10-20 10:13:35,045]({qtp885851948-51} NotebookServer.java [runParagraph]:615) - 运行异常org.apache.zeppelin.interpreter.InterpreterException:在org.apache中找不到sql解释器.zeppelin.notebook.NoteInterpreterLoader.get(NoteInterpreterLoader.java:148)org.apache.zeppelin.notebook.Note.run(Note.java:282)org.apache.zeppelin.socket.NotebookServer.runParagraph(NotebookServer.java) :613)org.apache.zeppelin.socket.NotebookServer.onMessage(NotebookServer.java:126)位于org.eclipse.jetty.websocket的org.apache.zeppelin.socket.NotebookSocket.onMessage(NotebookSocket.java:56). WebSocketConnectionRFC6455 $ WSFrameHandler.onFrame(WebSocketConnectionRFC6455.java:835)位于org.eclipse.jetty.websocket.WebSocketParserRFC6455.parseNext(WebSocketParserRFC6455.java:349)atg.eclipse.jetty上的org.eclipse.jetty.webocket.WebSocketConnectionRFC6455.handle(WebSocketConnectionRFC6455.java:225)org.eclipse.jetty.nle.SelectChannelEndPoint.handle(SelectChannelEndPoint.java:667) .io.nio.SelectChannelEndPoint $ 1.run(SelectChannelEndPoint.java:52)atg.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)org.eclipse.jetty.util.thread.QueuedThreadPool $ 3 .run(QueuedThreadPool.java:543)在java.lang.Thread.run(Thread.java:745)java:52)org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)at org.eclipse.jetty.util.thread.QueuedThreadPool $ 3.run(QueuedThreadPool.java:543)at java. lang.Thread.run(Thread.java:745)java:52)org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:608)at org.eclipse.jetty.util.thread.QueuedThreadPool $ 3.run(QueuedThreadPool.java:543)at java. lang.Thread.run(Thread.java:745)
我试图在Apache Zeppelin上完成以下用例:例如,当我编写一个sql查询时
%sql SELECT * FROM table1 WHERE column1 = ${column1=1,1|2|3|4}
Run Code Online (Sandbox Code Playgroud)
我得到一个组合框,显示这些值(1,2,3,4)作为选项.我想要做的是使用此列可用的所有不同值填充此列表(或者事实上,我可能希望从变量形式的另一段中获取任何其他值集).所以目前我仍然坚持如何在另一段中的sql语句中使用一个段落中定义的变量?
潜入代码,我看到在Zeppelin解释器中,一个名为Input.java的文件检查模式$ {someColumn = someValues},填充组合框选项,然后创建一个简单的查询,因此我已经删除通过在同一段落中运行查询来填充它的想法.
zeppelin R解释器文档说明:
If you return a data.frame, Zeppelin will attempt to display it using Zeppelin's built-in visualizations.
Run Code Online (Sandbox Code Playgroud)
这可以在文档示例中看到:
但是,当我尝试从我的zeppelin 0.6.0笔记本运行相同的R命令时,我看到以下内容:
知道为什么我没有看到表格输出吗?
如何在Zeppelin中为%hive解释器添加一个jar?
我试过了
%z.dep('');
add jar <jar path>
Run Code Online (Sandbox Code Playgroud)
此外,zeppelin hive解释器抛出ClassNotFoundException
./interpreter/hive/在add jar说找不到文件的同时添加了通过 thrift异常.
怎么做?我试图通过亚马逊添加jsonserde.jar来解析DynamoDB导入.
在Zeppelin中运行Spark bisecting kmmeans算法.
//I transform my data using the TF-IDF algorithm
val idf = new IDF(minFreq).fit(data)
val hashIDF_features = idf.transform(dbTF)
//and parse the transformed data to the clustering algorithm.
val bkm = new BisectingKMeans().setK(100).setMaxIterations(2)
val model = bkm.run(hashIDF_features)
val cluster_rdd = model.predict(hashIDF_features)
Run Code Online (Sandbox Code Playgroud)
我总是得到这个错误:
org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 270.0 failed 4 times, most recent failure: Lost task 0.3 in stage 270.0 (TID 126885, IP): java.util.NoSuchElementException: key not found: 67
at scala.collection.MapLike$class.default(MapLike.scala:228)
at scala.collection.AbstractMap.default(Map.scala:58)
at …Run Code Online (Sandbox Code Playgroud) 键盘快捷键有一个旧的jira.但似乎没有相关文件
https://issues.apache.org/jira/browse/ZEPPELIN-391
快捷方式是否有全面的备忘单?特别是与优秀的jupyter键盘快捷键相比; 例如,dd删除一个单元格.
从Zeppelin-0.7开始,Zeppelin开始使用Helium Framework支持Helium插件/软件包.但是,我无法在Helium页面上查看任何插件(localhost:8080 /#/ helium).根据这个JIRA,我在/ local-repo/helium-registry-cache下放置了样本Helium.json(在s3上可用).但是,之后我在重启Apache Zeppelin服务时获得了NPE.
我尝试过Zeppelin 0.7以及Zeppelin 0.8.0 snaptshot版本.特别是,我想在Zeppelin笔记中使用地图Helium包 - Helium-Map.
有人可以向我指出在Zeppelin中使用Helium包的详细步骤的任何指南或文档吗?任何帮助将不胜感激!
我需要从zeppelin中的%sql解释器导出csv格式的数据.我怎么能这样做?我需要添加一个按钮并点击它,它应该导出csv中的数据,如客户端的sql解释器中的zeppelin中的图形所示.
apache-zeppelin ×10
apache-spark ×2
amazon-emr ×1
apache ×1
hive ×1
jar ×1
json ×1
scala ×1
sparkr ×1
sql ×1