标签: azure-machine-learning-studio

无法在Azure机器学习中将PlainText(JSON)连接到数据集

我上传的JSON格式到新的Azure的机器学习工作室(studio.azureml.net)的纯文本文件,但我不能与任何模块明文对象连接.我总是得到错误消息"无法将PlainText连接到数据集......".

在文档(这里)写道:"可以读取纯文本,然后在下游预处理模块的帮助下将其拆分成列."但是我找不到任何下游预处理模块.

machine-learning azure azure-machine-learning-studio

5
推荐指数
1
解决办法
1813
查看次数

天蓝色ml的定时测试

我创建了各种大小的数据集,例如1GB,2GB,3GB,4GB(<10 GB),并在Azure ML上执行各种机器学习模型.

1)我可以知道Azure ML服务中提供的服务器规范(RAM,CPU).

2)有时读者会说"内存耗尽"大于4GB的数据.虽然azure ml应该能够按照文档处理10GB的数据.

3)如果我并行运行多个实验(在浏览器的不同选项卡中),则需要更多时间.

4)有没有办法在Azure ML中设置RAM,CPU核心

performance azure azure-machine-learning-studio cortana-intelligence

5
推荐指数
1
解决办法
135
查看次数

我们如何将Azure Machine Learning Studio连接到Google BigQuery?

我们正在尝试使用支持向量机对我们的数据集进行预测,但只有70,000行和7个功能 - 我们在Google DataLabs上尝试过SVM,但我们的数据集太大,无法在DataLabs VM的任何合理有限时间内进行计算.

我们希望利用一种方法来扩展CPU内核的统计方法,例如Azure Machine Learning Studio上的Revolution Analytics版本的R,但我们的数据是在Google BigQuery上.

我们如何在Azure Machine Learning Studio上连接R脚本以在Google BigQuery上使用我们的数据集?

r svm google-bigquery azure-machine-learning-studio google-cloud-datalab

5
推荐指数
1
解决办法
498
查看次数

Azure机器学习结果解释

我尝试在Azure机器学习中进行“决策森林回归”算法来预测天气的实验。 在此处输入图片说明

我使用AML Studio建议的天气数据集(在机场有40万行Wheater)。 在此处输入图片说明

我想预测“ DryBulbCelsus”列(其值在20到23之间),因此我选择了“火车模型”中的列。我运行它一切顺利。但是问题是我不了解我的分数模型。我还有另外2列结果“得分标签平均值”和“得分标签标准偏差”,其中包含我无法理解的数据。 在此处输入图片说明

如果有人使用AML并且可以向我解释我如何解释结果数据。谢谢 !

regression azure azure-machine-learning-studio

5
推荐指数
1
解决办法
1203
查看次数

Azure ML:如何使用分号作为分隔符保存和处理CSV文件?

Azure ML支持告诉我,分隔符必须是逗号,这会导致数据以分号作为分隔符并且单元格值中包含大量逗号的数据会造成太多麻烦.

那么如何在Azure ML中处理以分号分隔的CSV文件?

csv escaping azure escapestring azure-machine-learning-studio

5
推荐指数
1
解决办法
2088
查看次数

在Azure ML中安装Python程序包?

这里类似的问题,但现在在Python软件包上。当前,Azure ML中缺少CVXPY。我还试图让其他求解器(例如GLPK,CLP和COINMP)在Azure ML中工作。

如何在Azure ML中安装Python包?


有关尝试安装Azure ML中找不到的Python软件包的更新。

我按照Peter Pan的指示进行了操作,但是我认为Azure ML中的Anaconda 4和Python 3.5的32位CVXPY文件是错误的,日志和错误在此处

[Information]         Running with Python 3.5.1 |Anaconda 4.0.0 (64-bit)| (default, Feb 16 2016, 09:49:46) [MSC v.1900 64 bit (AMD64)]
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

在此处输入图片说明

在此处输入图片说明

使用win_amd64文件更新2(在此处粘贴)

[Information]         Extracting Script Bundle.zip to .\Script Bundle
[Information]         File Name                                             Modified             Size
[Information]         cvxopt-1.1.9-cp35-cp35m-win_amd64.whl          2017-06-07 01:03:34      1972074
[Information]         __MACOSX/                                      2017-06-07 01:26:28            0
[Information]         __MACOSX/._cvxopt-1.1.9-cp35-cp35m-win_amd64.whl 2017-06-07 01:03:34          452
[Information]         cvxpy-0.4.10-py3-none-any.whl                  2017-06-07 00:25:36       300880
[Information]         __MACOSX/._cvxpy-0.4.10-py3-none-any.whl       2017-06-07 00:25:36          444
[Information]         ecos-2.0.4-cp35-cp35m-win_amd64.whl            2017-06-07 01:03:40        56522
[Information] …
Run Code Online (Sandbox Code Playgroud)

python azure azure-machine-learning-studio cvxpy

5
推荐指数
1
解决办法
5326
查看次数

如何在导入数据集时阻止Azure ML Studio将要素列转换为DateTime

我在尝试在Azure ML Studio中加载数据集时遇到了一些问题,这是一个包含看起来像DateTime的列的数据集,但实际上是一个字符串.Azure ML Studio在内部将值转换为DateTimes,并且没有任何争论似乎说服它们实际上是字符串.

这是一个问题,因为在转换过程中,值会丢失精度并开始显示为重复,而实际上它们是唯一的.有人知道ML Studio是否可以配置为在导入数据集时不推断列的数据类型?

现在,对于漫长的(呃)故事:)

我在这里使用公共数据集 - 特别是Kaggle的纽约市票价预测竞赛.我想看看我是否可以使用Azure ML Studio做一个快速而肮脏的解决方案,但是数据集的唯一键值是形式 2015-01-27 13:08:24.0000003 2015-01-27 13:08:24.0000002 2011-10-06 12:10:20.0000001 等等.

在我的实验中导入它们时,键值将转换为DateTime,使它们不再是唯一的,即使它们在csv中是唯一的.毋庸置疑,这使我无法向Kaggle提交任何解决方案,因为我无法唯一地识别行:).

我尝试过以下方法:

  • 在加载数据集之后编辑数据集的元数据并将列的数据类型设置为字符串,但这并没有做太多,因为精度已经丢失
  • 从Azure blob导入数据集,将其转换为csv,然后在Jupyter/Python中加载它 - 这给我带来了相同的(重复的)密钥.
  • 正如预期的那样,使用pandas在本地加载数据集.

我用大的5.5GB train数据集重现了这种行为,但也使用了更易于管理的sample_submission数据集.

很想知道是否有某种解决方法告诉M​​L Studio在加载数据集时不要尝试转换此列.我在这里专门针对Azure ML Studio解决方案,因为我不想对数据集进行任何预处理.

azure azure-machine-learning-studio kaggle ml-studio

5
推荐指数
1
解决办法
149
查看次数

为什么只有一个隐藏节点的IRIS数据集具有良好的准确性?

我有一个带有反向传播训练器的神经网络的最小示例,可以在IRIS数据集上对其进行测试。我从7个隐藏节点开始,它运作良好。

我将隐藏层中的节点数减少到1(预计会失败),但是惊讶地发现精度提高了。

我在azure ml中设置了实验,只是为了验证这不是我的代码。那里同样,单个隐藏节点的准确性为98.3333%。

谁能向我解释这里发生了什么?

machine-learning backpropagation neural-network azure-machine-learning-studio

4
推荐指数
1
解决办法
2920
查看次数

Panda AssertionError列传递,传递的数据有2列

我正在使用NLTK进行文本分析的Azure ML实现,以下执行正在抛出

AssertionError: 1 columns passed, passed data had 2 columns\r\nProcess returned with non-zero exit code 1
Run Code Online (Sandbox Code Playgroud)

下面是代码

# The script MUST include the following function,
# which is the entry point for this module:
# Param<dataframe1>: a pandas.DataFrame
# Param<dataframe2>: a pandas.DataFrame
def azureml_main(dataframe1 = None, dataframe2 = None):
    # import required packages
    import pandas as pd
    import nltk
    import numpy as np
    # tokenize the review text and store the word corpus
    word_dict = {}
    token_list = [] …
Run Code Online (Sandbox Code Playgroud)

python nltk dataframe pandas azure-machine-learning-studio

4
推荐指数
1
解决办法
2万
查看次数

解压自动训练模型时没有名为“automl”的模块

我正在尝试使用我自己的数据集而不是 MNIST 数据集来重现下面的 2 个教程。 https://docs.microsoft.com/ja-jp/azure/machine-learning/service/tutorial-auto-train-models https://docs.microsoft.com/ja-jp/azure/machine-learning/service /tutorial-deploy-models-with-aml

关于 '/notebooks/tutorials/03.auto-train-models.ipynb' 没有问题。我有'model.pkl'。

但是,“/notebooks/tutorials/02.deploy-models.ipynb”在“预测测试数据”单元格中存在以下错误。我想这是“泡菜”和“进口”的问题。

请告诉我解决方案。

ModuleNotFoundError                       Traceback (most recent call last)
<ipython-input-6-11cf888b622f> in <module>
      2 from sklearn.externals import joblib
      3 
----> 4 clf = joblib.load('./model.pkl')
      5 # clf = joblib.load('./sklearn_mnist_model.pkl')
      6 y_hat = clf.predict(X_test)

~/anaconda3_501/lib/python3.6/site-packages/sklearn/externals/joblib/numpy_pickle.py in load(filename, mmap_mode)
    576                     return load_compatibility(fobj)
    577 
--> 578                 obj = _unpickle(fobj, filename, mmap_mode)
    579 
    580     return obj

~/anaconda3_501/lib/python3.6/site-packages/sklearn/externals/joblib/numpy_pickle.py in _unpickle(fobj, filename, mmap_mode)
    506     obj = None
    507     try:
--> 508         obj = unpickler.load()
    509         if unpickler.compat_mode: …
Run Code Online (Sandbox Code Playgroud)

python pickle azure-machine-learning-studio automl

4
推荐指数
1
解决办法
3243
查看次数