小编Nag*_*gam的帖子

AWS Glue Spark Sagemaker Notebook 出现故障

无法运行 AWS Glue Sagemaker Notebook，它在启动时抛出错误。如果我错过了什么，有人可以告诉我吗？

PS：按照错误日志中的建议，我重新启动了内核几次，但没有帮助。

import sys
from awsglue.transforms import *
from awsglue.utils import getResolvedOptions
from pyspark.context import SparkContext
from awsglue.context import GlueContext
from awsglue.job import Job

glueContext = GlueContext(SparkContext.getOrCreate())

Run Code Online (Sandbox Code Playgroud)

错误

The code failed because of a fatal error:
    Error sending http request and maximum retry encountered..

Some things to try:
a) Make sure Spark has enough available resources for Jupyter to create a Spark context.
b) Contact your Jupyter administrator to make sure the Spark magics library is …

Run Code Online (Sandbox Code Playgroud)

python apache-spark pyspark amazon-sagemaker

Nag*_*gam

2020 11-04

7
推荐指数

1
解决办法

1986
查看次数

ArrowTypeError: 没有通过 numpy.dtype 对象'，'类型为 int32 的 X 列的转换失败

问题

我正在尝试将数据框保存为 Databricks 上的镶木地板文件，得到 ArrowTypeError。

Databricks 运行时版本：7.6 ML（包括 Apache Spark 3.0.1、Scala 2.12）

日志跟踪

ArrowTypeError: ('Did not pass numpy.dtype object', 'Conversion failed for column inv_yr with type int32')

Run Code Online (Sandbox Code Playgroud)

python numpy pandas databricks pyarrow

Nag*_*gam

lucky-day

5
推荐指数

1
解决办法

2104
查看次数

有没有办法使用 MLflow 记录数据集的描述性统计信息？

有没有办法使用 MLflow 记录数据集的描述性统计信息？如果有的话可以分享一下详情吗？

python mlflow

Nag*_*gam

lucky-day

2
推荐指数

2
解决办法

1829
查看次数

标签统计

python ×3

amazon-sagemaker ×1

apache-spark ×1

databricks ×1

mlflow ×1

numpy ×1

pandas ×1

pyarrow ×1

pyspark ×1

AWS Glue Spark Sagemaker Notebook 出现故障

ArrowTypeError: 没有通过 numpy.dtype 对象'，'类型为 int32 的 X 列的转换失败

问题

日志跟踪

有没有办法使用 MLflow 记录数据集的描述性统计信息？

标签 统计

小编Nag_gam的帖子

标签统计