mar*_*est 0 apache-spark deep-learning databricks
我正在 databricks 社区版上使用 Sparkdl 进行图像分类。我添加了所有图书馆的。我已经使用图像数据创建了数据框。
from pyspark.ml.classification import LogisticRegression
from pyspark.ml import Pipeline
from sparkdl import DeepImageFeaturizer
featurizer = DeepImageFeaturizer(inputCol="image", outputCol="features", modelName="InceptionV3")
lr = LogisticRegression(maxIter=20, regParam=0.05, elasticNetParam=0.3, labelCol="label")
p = Pipeline(stages=[featurizer, lr])
p_model = p.fit(train_df)
AttributeError Traceback (most recent call last)
<command-2468766328144961> in <module>()
7 p = Pipeline(stages=[featurizer, lr])
8
----> 9 p_model = p.fit(train_df)
/databricks/spark/python/pyspark/ml/base.py in fit(self, dataset, params)
62 return self.copy(params)._fit(dataset)
63 else:
---> 64 return self._fit(dataset)
65 else:
66 raise ValueError("Params must be either a param map or a list/tuple of param maps, "
/databricks/spark/python/pyspark/ml/pipeline.py in _fit(self, dataset)
104 if isinstance(stage, Transformer):
105 transformers.append(stage)
--> 106 dataset = stage.transform(dataset)
107 else: # must be an Estimator
108 model = stage.fit(dataset)
Run Code Online (Sandbox Code Playgroud)
从您的问题标题来看,听起来您AttributeError: 'ConsoleBuffer' object has no attribute 'isatty'在 Databricks Python 笔记本中遇到了错误。
如果您使用Databricks Runtime 3.3或更高版本,则应修复此错误。
在早期的 Databricks Runtime 版本中,您应该能够通过sys.stdout在 Python 笔记本的开头运行以下代码片段进行猴子修补来解决此问题:
import sys
sys.stdout.isatty = lambda: False
sys.stdout.encoding = sys.getdefaultencoding()
Run Code Online (Sandbox Code Playgroud)
Databricks 的 Python REPL 重写sys.stdout以使用我们自己的ConsoleBuffer类,并且在 Databricks Runtime 3.3 之前,此类未实现isatty和encoding方法。
资料来源:我是一名负责此错误修复的 Databricks 员工。
| 归档时间: |
|
| 查看次数: |
3873 次 |
| 最近记录: |