小编Rom*_*ain的帖子

从另一个DataFrame添加一列

在Scala Spark中,我可以轻松地将列添加到现有的Dataframe编写中

val newDf = df.withColumn("date_min", anotherDf("date_min"))

在PySpark中这样做会导致错误AnalysisException

这是我在做什么:

minDf.show(5)
maxDf.show(5)
+--------------------+
|            date_min|
+--------------------+
|2016-11-01 10:50:...|
|2016-11-01 11:46:...|
|2016-11-01 19:23:...|
|2016-11-01 17:01:...|
|2016-11-01 09:00:...|
+--------------------+
only showing top 5 rows

+--------------------+
|            date_max|
+--------------------+
|2016-11-01 10:50:...|
|2016-11-01 11:46:...|
|2016-11-01 19:23:...|
|2016-11-01 17:01:...|
|2016-11-01 09:00:...|
+--------------------+
only showing top 5 rows
Run Code Online (Sandbox Code Playgroud)

然后,导致错误的是:

newDf = minDf.withColumn("date_max", maxDf["date_max"])

AnalysisExceptionTraceback (most recent call last)
<ipython-input-13-7e19c841fa51> in <module>()
      2 maxDf.show(5)
      3 
----> 4 newDf = minDf.withColumn("date_max", maxDf["date_max"])

/opt/spark-2.1.0-bin-hadoop2.7/python/pyspark/sql/dataframe.pyc in withColumn(self, colName, col) …
Run Code Online (Sandbox Code Playgroud)

apache-spark apache-spark-sql pyspark

7
推荐指数
2
解决办法
8411
查看次数

什么是Azure API版本

我正在尝试访问Azure提供的GET请求的结果,如示例中所示:https : //msdn.microsoft.com/sv-se/library/azure/dn820159.aspx

我的问题是,这api-version是一个强制性参数,但是我不知道该写些什么。我对Azure Batch文档有些迷茫,它似乎并不完整。

我在Azure网页中找到了一些东西:https : //azure.microsoft.com/zh-cn/documentation/articles/search-api-versions/,并且api版本是api-version=2015-02-28。但是,如果我在浏览器中尝试过,则会收到以下回答:"key":"Reason","value":"The specified api version string is invalid"

我可以在api-version参数中添加任何内容吗?

azure azure-batch

5
推荐指数
1
解决办法
3275
查看次数

"Cache-Control: max-age=0" 每键缓存失效不做任何事情

我有一个 API 网关和一个 lambda 来查询它。我已将 API 网关上的缓存 ttl 设置为最大值 (3600)。

我正在测试 Postman 的 API。我的缓存正在多次查询,完全相同的 url 很快就会返回结果。

在某些情况下,我需要 lambda 使特定键的缓存无效。因此,我在 API Gateway 阶段编辑器中的“每键缓存失效”下停用了“需要授权”,并且我正在尝试与 Postman 一起执行相同的查询并添加“Cache-Control: max-age=0”标头在“使 API 网关缓存条目无效”部分下。

http://docs.aws.amazon.com/apigateway/latest/developerguide/api-gateway-caching.html

但是,我的缓存似乎没有清空,因为多次查询仍然很快。

amazon-web-services aws-api-gateway

2
推荐指数
1
解决办法
2295
查看次数

OSMnx 边几何属性缺失

我正在使用 OSMnx 来提取道路形状。然而,我发现OSM中的某些方式似乎只在OSMnx中部分地以几何方式表示。

您可以在立交桥涡轮上运行的可重现示例:

<union>
  <bbox-query s="43.604437753042106" w="1.4469172178876575" n="43.60670421020654" e="1.4497628267951939"/>
  <recurse type="up"/>
</union>
<print mode="meta"/>
Run Code Online (Sandbox Code Playgroud)

以及使用 OSMnx 加载该图的命令:

import osmnx as ox
G = ox.graph_from_bbox(43.60670421020654, 43.604437753042106, 1.4497628267951939, 1.4469172178876575, network_type='drive')
ox.plot_graph(G)
Run Code Online (Sandbox Code Playgroud)

如果我们以 32021916 路为例,使用调试器检查 G 变量显示 G._pred 包含表示该路的 2 个边:

  • 从节点 2271536804 到其前驱节点 359203175 :关联的边包含几何属性。
  • 从节点 359203175 到其前驱节点 359203168:关联的边不包含任何几何属性,为什么?

然而,绘制的图表是完整的并显示了该道路的部分。所以我的问题是:如何获得这条道路的完整几何属性?

python openstreetmap networkx

2
推荐指数
1
解决办法
1313
查看次数