我有一个 DynamoDB 表,我需要连接到 EMR Spark SQL 才能在该表上运行查询。我得到了带有发布标签 emr-4.6.0 和 Spark 1.6.1 的 EMR Spark Cluster。
我指的是文档:Analyze DynamoDB Data with Spark
连接到主节点后,我运行命令:
spark-shell --jars /usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jar
Run Code Online (Sandbox Code Playgroud)
它发出警告:
Warning: Local jar /usr/share/aws/emr/ddb/lib/emr-ddb-hadoop.jar does not exist, skipping.
Run Code Online (Sandbox Code Playgroud)
后来,当我使用
import org.apache.hadoop.dynamodb.read.DynamoDBInputFormat
import org.apache.hadoop.dynamodb.write.DynamoDBOutputFormat
它给出了错误:
error: object dynamodb is not a member of package org.apache.hadoop
import org.apache.hadoop.dynamodb.read.DynamoDBInputFormat
error: object dynamodb is not a member of package org.apache.hadoop
import org.apache.hadoop.dynamodb.write.DynamoDBOutputFormat
Run Code Online (Sandbox Code Playgroud)
我认为是导致此错误的 jar。我从哪里得到这个 emr-ddb-hadoop.jar?
我是d3.js的新手,我正在创建d3.js中json数据的折线图.当json数据在html文件中时,代码运行良好但我想从html中提取数据并将数据作为json文件引用.示例index.html如下所示:
<!DOCTYPE html>
<html lang="en">
<body>
<svg id="visualisation" width="1000" height="500"></svg>
<script src="http://d3js.org/d3.v3.min.js" charset="utf-8"></script>
<script>
function InitChart() {
var data = [{
"sale": "202",
"year": "2000"
}, {
"sale": "215",
"year": "2002"
}, {
"sale": "179",
"year": "2004"
}, {
"sale": "199",
"year": "2006"
}, {
"sale": "134",
"year": "2008"
}, {
"sale": "176",
"year": "2010"
}];
var vis = d3.select("#visualisation"),
WIDTH = 1000,
HEIGHT = 500,
MARGINS = {
top: 20,
right: 20,
bottom: 20,
left: 50
},
xScale = …
Run Code Online (Sandbox Code Playgroud) 默认情况下,我在 Google Spanner 中定义的表存储在“未命名”的默认架构中,如信息架构文档中所述。
我需要什么:我需要我定义的表具有命名模式。有没有办法创建命名模式并在其中包含表?
我做了什么:我跑SELECT * from INFORMATION_SCHEMA.SCHEMATA
了,结果有两行。一个是SCHEMA_NAME
as INFORMATION_SCHEMA
,另一个是空字符串,这是我定义表的地方。
我试图更新表中的SCHEMA_NAME
列,该列是一个空字符串,但似乎不支持 DML 语句。INFORMATION_SCHEMA.SCHEMATA
SCHEMA_NAME
有人可以给我一个关于如何进行这项工作的提示,或者这是否可能?已经谢谢了!