小编men*_*h84的帖子

Spark中的DataFrame,Dataset和RDD之间的区别

我只是想知道Apache Spark中的RDDDataFrame (Spark 2.0.0 DataFrame只是一个类型别名Dataset[Row])有什么区别?

你能把一个转换成另一个吗?

apache-spark rdd apache-spark-sql apache-spark-dataset

228
推荐指数
10
解决办法
10万
查看次数

$ locationChangeStart,$ routeChangeStart和$ stateChangeStart之间的区别

我不知道什么是这三个不同,与其相应的$locationChangeSuccess,$routeChangeSuccess$stateChangeSuccess.

angularjs

23
推荐指数
2
解决办法
2万
查看次数

在从其他列派生的数据框中添加新列(Spark)

我正在使用Spark 1.3.0和Python.我有一个数据框,我希望添加一个从其他列派生的附加列.像这样,

>>old_df.columns
[col_1, col_2, ..., col_m]

>>new_df.columns
[col_1, col_2, ..., col_m, col_n]
Run Code Online (Sandbox Code Playgroud)

哪里

col_n = col_3 - col_4
Run Code Online (Sandbox Code Playgroud)

我如何在PySpark中执行此操作?

python apache-spark apache-spark-sql pyspark

22
推荐指数
3
解决办法
3万
查看次数

在JAX-RS中使用Location头创建响应

我在NetBeans中使用来自实体的RESTful模板自动生成类,具有CRUD函数(使用POST,GET,PUT,DELETE注释).我有一个create方法的问题,在从前端插入实体后,我想创建更新响应,以便我的视图将自动(或异步,如果这是正确的术语)反映添加的实体.

我遇到了这个(示例)代码行,但用C#编写(我对此一无所知):

HttpContext.Current.Response.AddHeader("Location", "api/tasks" +value.Id);
Run Code Online (Sandbox Code Playgroud)

在Java中使用JAX-RS,无论如何都可以像在C#中一样获取当前的HttpContext并操纵头文件?

我最接近的是

Response.ok(entity).header("Location", "api/tasks" + value.Id);
Run Code Online (Sandbox Code Playgroud)

这个肯定是行不通的.在构建Response之前,我似乎需要获取当前的HttpContext.

谢谢你的帮助.

c# java jax-rs

11
推荐指数
1
解决办法
2万
查看次数

将Scala Iterable [元组]转换为RDD

我有一个元组列表,(String,String,Int,Double)我想转换为Spark RDD.

一般来说,如何将Scala Iterable [(a1,a2,a3,...,an)]转换为Spark RDD?

scala apache-spark rdd

10
推荐指数
1
解决办法
1万
查看次数

Hadoop,Oozie中的作业,应用程序,任务,任务尝试日志之间的差异

我正在运行一个有多个动作的Oozie工作,而且有一部分我无法使其工作.在故障排除过程中,我被大量日志所淹没.

在YARN UI中(yarn.resourceman­ager.webapp.address在yarn-site.xml中,通常在端口8088上),有application_<app_id>日志.

在Job History Server中(yarn.log.server.url在yarn-site.xml中,我们在端口19888上),有job_<job_id>日志.(这些工作日志也应该出现在Hue的Job Browser上,对吧?)

在Hue的Oozie工作流程编辑器中,有(task并且task_attempt不确定它们是否相同,对我来说一切都是混合汤),如果你点击这里,它会重定向到Job Browser.

有人可以从Hadoop/Oozie架构的角度解释这些东西之间的区别吗?

PS我也在日志中看到过container_<container_id>.不妨在你对上述事情的解释中包含这一点.

hadoop oozie

9
推荐指数
1
解决办法
3037
查看次数

使用 boto 时出现 SSLError

aws s3当使用命令在 CLI 中浏览存储桶时,我们使用的是代理 + 配置文件。

export HTTPS_PROXY=https://ourproxyhost.com:3128
aws s3 ls s3://our_bucket/.../ --profile dev
Run Code Online (Sandbox Code Playgroud)

我们可以很好地处理我们的水桶和物体。

因为我需要为此编写 Python 代码,所以我使用 boto3 对其进行了翻译:

# python 2.7.12
import boto3                        # v1.5.18
from botocore.config import Config  # v1.8.32

s3 = boto3.Session(profile_name='dev').resource('s3', config=Config(proxies={'https': 'ourproxyhost.com:3128'})).meta.client
obj = s3.get_object(Bucket='our_bucket', Key='dir1/dir2/.../file')
Run Code Online (Sandbox Code Playgroud)

我得到的是这样的:

botocore.vendored.requests.exceptions.SSLError: [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed (_ssl.c:590)
Run Code Online (Sandbox Code Playgroud)

为什么这在 CLI 中有效,但在 Python 中却无效?

python amazon-s3 python-2.7 botocore boto3

9
推荐指数
1
解决办法
2万
查看次数

AngularJS:来自第二个索引的ng-repeat

我想ng-repeat,但只能从第二个数组元素到最后一个.我试着用

ng-repeat="entry in entries | filter: $index==0"
Run Code Online (Sandbox Code Playgroud)

但是这个没用.如果我尝试使用ng-if,就像这样

ng-repeat="entry in entries" ng-if="$index != 0"
Run Code Online (Sandbox Code Playgroud)

我在翻译中遇到错误.

什么是最好的解决方案?顺便说一句,我的AngularJS版本是1.1.5,因为我的应用程序是Hawtio的插件(它仍然停留在1.1.5版本中).谢谢.

angularjs angularjs-ng-repeat

7
推荐指数
3
解决办法
1万
查看次数

Hive的unix_timestamp和from_unixtime函数

我的印象是unix_timestampfrom_unixtime Hive函数彼此"反向".

当我尝试将时间戳字符串转换为Hive中的秒数时:

SELECT unix_timestamp('10-Jun-15 10.00.00.000000 AM', 'dd-MMM-yy hh.mm.ss.MS a');
Run Code Online (Sandbox Code Playgroud)

我得到了1418176800.

当我尝试将1418176800转换为时间戳字符串时:

SELECT from_unixtime(1418176800, 'dd-MMM-yy hh.mm.ss.MS a');
Run Code Online (Sandbox Code Playgroud)

我得到10月12日 - 10月14日10.00.00.120 AM,这显然不等于原版.

有人可以解释发生了什么吗?谢谢.

hive hiveql

7
推荐指数
1
解决办法
5万
查看次数

AngularJS指令中没有值的属性

我写了一个带隔离范围的指令.

app.directive('myDirective', function() {
    return {
        restrict: 'E',
        scope {
            attr1: '@',
            attr2: '@',
            noValueAttr: // what to put here?
        },
        link: function(scope, elem, attrs) {
            // how to check here if noValueAttr is present in mark-up?
        }
    };
});
Run Code Online (Sandbox Code Playgroud)

HTML可能是

<my-directive attr1='...' attr='...' ... no-value-attr>
Run Code Online (Sandbox Code Playgroud)

要么

<my-directive attr1='...' attr='...' >
Run Code Online (Sandbox Code Playgroud)

我想知道如何使用(并使指令检测它是否存在)一个没有赋值的可选属性.谢谢.

angularjs angularjs-directive

6
推荐指数
1
解决办法
5451
查看次数