标签: machine-learning

OpenCV2 imwrite is writing a black image

I am messing around with opencv2 for neural style transfer... In cv2.imshow("Output", output), I am able to say my picture. But when I write output to file with cv2.imwrite("my_file.jpg", output). Is it because my file extension is wrong? When I do like cv2.imwrite("my_file.jpg", input) though, it does show my original input picture. Any ideas? Thank you in advance.

# import the necessary packages
from __future__ import print_function
import argparse

import time
import cv2
import imutils

import numpy as np
from …

Run Code Online (Sandbox Code Playgroud)

opencv machine-learning computer-vision

Acy*_*Acy

lucky-day

-1
推荐指数

1
解决办法

680
查看次数

文档聚类

是否有可用于改进文档聚类结果的人工智能算法？用于聚类的算法可以是分层的或任何其他的.

谢谢

nlp artificial-intelligence cluster-analysis machine-learning

pro*_*ild

2012 09-15

-2
推荐指数

1
解决办法

653
查看次数

使用JavaScript进行机器学习

嘿,我是新手机器学习和AI ..我喜欢JavaScript并且想用它来做同样的事情..任何人都建议一本好的书/资源...我也读过这python是一个首选的编程语言AI和machine learning. .你能告诉我为什么吗？

javascript python artificial-intelligence machine-learning

Kar*_*har

2016 05-23

-2
推荐指数

1
解决办法

344
查看次数

如果相关性大于0.75，请从熊猫的数据框中删除该列

我有一个数据框名称data，通过使用该数据框名称绘制了相关矩阵

corr = data.corr()

Run Code Online (Sandbox Code Playgroud)

我想如果corr两列之间大于0.75，则从dataframe中删除其中之一data。我尝试了一些选择

raw =corr[(corr.abs()>0.75) & (corr.abs() < 1.0)]

Run Code Online (Sandbox Code Playgroud)

但这没有帮助，我需要原始值不为零的原始列号。基本上是以下R命令的一些python命令替换

{hc=findCorrelation(corr,cutoff = 0.75)

hc = sort(hc)

data <- data[,-c(hc)]}

Run Code Online (Sandbox Code Playgroud)

如果有人可以帮助我获取类似于上面提到的python pandas中的R命令的命令，那将很有帮助。

python r machine-learning pandas scikit-learn

Ava*_*hra

2017 07-04

-2
推荐指数

1
解决办法

4800
查看次数

为什么ML.net中需要标签列？

我有 2000 万条数据集记录来训练模型。

为什么我必须添加标签列？

c# machine-learning ml.net

作者

2019 11-16

-2
推荐指数

1
解决办法

1088
查看次数

使用机器学习将两个数字相加的模型

我正在尝试使用机器学习来对添加进行建模。但模型的预测总是相同的。这是我的代码：

import numpy as np
import random
from sklearn.naive_bayes import GaussianNB

X=np.array([[0,1],[1,1],[2,1],[2,2],[2,3],[3,3],[3,4],[4,4],[4,5]])
Y=np.array([1,2,3,4,5,6,7,8,9])

clf = GaussianNB()
clf.fit(X,Y)
x=random.random()
y=random.random()
d=1
e=10000
accuracy=0
while d<e:
    d+=1
    if (clf.predict([[x, y]])) == x+y:
        accuracy+=1
    if d==e:
        print(accuracy)

Run Code Online (Sandbox Code Playgroud)

在 10000 次预测中，零预测 Y 是，并且将 X 中的两个随机变量相加，出了什么问题。

python numpy machine-learning

cav*_*ton

2020 08-27

-2
推荐指数

1
解决办法

274
查看次数

机器学习中的“适合”是什么？

机器学习中的“适合”是什么？我注意到在某些情况下它是培训的同义词。

有人可以用通俗的语言解释一下吗？

machine-learning data-science

作者

lucky-day

-2
推荐指数

1
解决办法

4377
查看次数

Python 中的 KNN 实现

我正在尝试在 Python 中实现一个简单的 KNN 技术，其中我使用每分钟的股票价格数据，并使用我的 x 变量作为开盘价、收盘价和交易量数据来预测下一分钟的开盘价。我的代码如下：-

import numpy as np
import pandas as pd
import scipy
import matplotlib.pyplot as plt
from pylab import rcParams
import urllib
import sklearn
from sklearn.neighbors import KNeighborsRegressor
from sklearn import neighbors
from sklearn import preprocessing
from sklearn.cross_validation import train_test_split
from sklearn import metrics 
from googlefinance.client import get_price_data, get_prices_data, get_prices_time_data
import copy

np.set_printoptions(precision = 4, suppress = True)
rcParams['figure.figsize']=7,4
plt.style.use('seaborn-whitegrid')




param = {'q':"DJUSBK", 'i':"60",'x':"INDEXDJX",'p':"1Y"} # Dow Joes Banks
djusbk = get_price_data(param)
ticker_list=['ASB','BXS','BAC','BOH','BKU'] # 5 stocks …

Run Code Online (Sandbox Code Playgroud)

python machine-learning knn python-3.x scikit-learn

Deb*_*dar

2018 06-25

-3
推荐指数

1
解决办法

595
查看次数

MultiLabelBinarizer 在逆变换时混合数据

我正在使用sklearn的multilabelbinarizer()来训练我的机器学习中的多个列，我用它来训练我的模型。

使用它后，我注意到它在逆变换时混淆了我的数据。我创建了一组随机值的测试集，在其中拟合数据、对其进行转换，然后inverse_transform将数据恢复为原始数据。

我进行了一个简单的测试jupyter笔记本上进行了一个简单的测试以显示错误：

在inverse_transformed第 1 行的值中，它混淆了州和月份。

jupyter笔记本代码

首先，我的使用方式是否有错误multilabelbinarizer？有没有不同的方法来实现相同的输出？

编辑： 感谢@Nicolas M. 帮助我解决我的问题。我最终像这样解决了这个问题。

请原谅我的粗略解释，但结果比我最初想象的要复杂。我改用 thelabel_binarizer而不是multi_label_binarizer因为它

我最终腌制了label_binarizer defaultdict以便我可以加载它并在我的机器学习项目的不同模块中使用它。

一件可能不简单的事情是我向为每一列制作的数据帧添加新标题。它采用列名+列号的形式。我这样做是因为我需要对数据进行逆变换。为此，我搜索了包含原始列名称的列，该列名称将较大的数据帧分隔成各个列块。

这里是我使用的一些变量及其含义供参考：
lb_dict- 存储不同标签二值化器的默认字典。
binarize_df- 存储二进制数据的数据框。
binarized_label- label 将列中的一个标签二值化。
header- 创建一个新的标题形式：列名+数字列。

inverse_df- 存储逆变换数据的数据帧。
one_label_list- 查找具有原始列标签的列名称列表。
one_label_df- 创建一个新的数据框，仅存储一列的二值化数据。
single_label- 被反向转换成一列的二值化数据。

在此代码中，数据是我传递给函数的数据帧。

lb_dict = defaultdict(LabelBinarizer)
# create a place holder dataframe to join new binarized data to
binarize_df = pd.DataFrame(['x'] …

Run Code Online (Sandbox Code Playgroud)

python machine-learning pandas multilabel-classification sklearn-pandas

Eth*_*lla

2018 08-23

-3
推荐指数

1
解决办法

1097
查看次数

回归问题：如何解决高位小数输入特征的问题

我有以下输入数据结构：

   X1     |    X2     |    X3     | ... | Output (Label)
118.12341 | 118.12300 | 118.12001 | ... | [a value between 0 & 1] e.g. 0.423645

Run Code Online (Sandbox Code Playgroud)

我使用它tensorflow来解决预测Output变量未来值的回归问题。为此，我构建了一个前馈神经网络，该网络具有三个具有relu激活函数的隐藏层和一个具有一个节点的最终输出层linear activation。该网络使用优化器通过反向传播进行训练adam。

我的问题是，在对网络进行了数千次训练后，我意识到输入特征和输出中的这种高度小数的值仅导致预测接近小数点后第二位，例如：

Real value = 0.456751 | Predicted value = 0.452364

Run Code Online (Sandbox Code Playgroud)

然而，这不被接受，我需要精确到小数点后第四位（至少）才能接受该值。

问：是否有任何值得信赖的技术可以正确解决这个问题以获得更好的结果（也许是转换算法）？

提前致谢。

machine-learning data-analysis neural-network keras tensorflow

pet*_*nce

lucky-day

-3
推荐指数

1
解决办法

1528
查看次数

标签统计

machine-learning ×10

python ×5

artificial-intelligence ×2

pandas ×2

scikit-learn ×2

c# ×1

cluster-analysis ×1

computer-vision ×1

data-analysis ×1

data-science ×1

javascript ×1

keras ×1

knn ×1

ml.net ×1

multilabel-classification ×1

neural-network ×1

nlp ×1

numpy ×1

opencv ×1

python-3.x ×1

r ×1

sklearn-pandas ×1

tensorflow ×1

标签 统计

标签统计