小编mah*_*kya的帖子

为什么一个热门编码可以提高机器学习性能?

我注意到,当在特定数据集(矩阵)上使用One Hot编码并将其用作学习算法的训练数据时,与使用原始矩阵本身作为训练数据相比,它在预测准确性方面提供了明显更好的结果.这种性能提升如何发生?

machine-learning data-mining data-analysis scikit-learn

123
推荐指数
1
解决办法
4万
查看次数

只获取numpy数组中每一行的特定列

可能重复:
numpy:按列访问数组

我有一个numpy数组(numpy导入为np)

gona = np.array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [10, 11, 12]])
Run Code Online (Sandbox Code Playgroud)

我可以通过gona [1] [:]得到第1行整列的值.

数组([4,5,6])

但是如果我尝试获取所有行的特定列的所有值(比如我想要每行中第1列的值),我会尝试gona [:] [1].但是我得到的结果和以前一样.

这可能是什么原因?我怎么在numpy做这样的事情?

python numpy python-2.7

16
推荐指数
2
解决办法
8万
查看次数

在Python中编写和读取相同的csv文件

我们可以写一下(这里应该编辑)并使用csv库在Python中同时读取相同的csv文件吗?

可以打开csv文件进行编辑和追加吗?

如果是这样,怎么样?

python csv python-2.7

7
推荐指数
1
解决办法
7072
查看次数

在python中处理一个非常大的数据集 - 内存错误

我正在尝试使用python中的csv模块处理从csv文件获取的数据.这里有大约50列和401125行.我使用以下代码块将该数据放入列表中

csv_file_object = csv.reader(open(r'some_path\Train.csv','rb'))
header = csv_file_object.next()
data = []
for row in csv_file_object:
    data.append(row)
Run Code Online (Sandbox Code Playgroud)

我可以使用len(数据)获取此列表的长度并返回401125.我甚至可以通过调用列表索引来获取每个单独的记录.但是当我尝试通过调用np.size(data)来获取列表的大小时(我将numpy导入为np),我获得了以下堆栈跟踪.

MemoryError Traceback(最近一次调用last)in()----> 1 np.size(data)

C:\ Python27\lib\site-packages \numpy\core\fromnumeric.pyc in size(a,axis)2198返回a.size 2199除AttributeError: - > 2200返回asarray(a).size 2201 else:2202试试:

asarray中的C:\ Python27\lib\site-packages \numpy\core \numeric.pyc(a,dtype,order)233 234""" - > 235返回数组(a,dtype,copy = False,order = order )236 237 def asanyarray(a,dtype = None,order = None):

的MemoryError:

我甚至无法使用列表索引将该列表分成多个部分或将此列表转换为numpy数组.它给出了同样的内存错误.

我该如何处理这种大数据样本.有没有其他方法来处理像这样的大型数据集.

我在Windows 7专业版中使用ipython笔记本.

python numpy data-analysis python-2.7

6
推荐指数
1
解决办法
4万
查看次数

Python中的Observer Observable类

如何在Java中使用Python中的观察者/可观察设施编写程序?我会在Java中写下类似的东西.

import java.util.Observable;
import java.util.Observer;


public class ObservDemo extends Object {
  MyView view;
  MyModel model;

  public ObservDemo() {

    view = new MyView();
    model = new MyModel();
    model.addObserver(view);

  }

  public static void main(String[] av) {
    ObservDemo me = new ObservDemo();
    me.demo();
  }

  public void demo() {
    model.changeSomething();
  }

  /** The Observer normally maintains a view on the data */
  class MyView implements Observer {
    /** For now, we just print the fact that we got notified. */
    public void update(Observable obs, …
Run Code Online (Sandbox Code Playgroud)

python

4
推荐指数
1
解决办法
6179
查看次数

IPython笔记本不起作用

我试着运行IPython笔记本.我在命令行中输入了以下内容:

ipython笔记本

我收到以下错误(堆栈跟踪)

> Traceback (most recent call last):   File
> "C:\Python27\Scripts\ipython-script.py", line 9, in <module>
>     load_entry_point('ipython==0.13.1', 'console_scripts', 'ipython')()   File
> "C:\Python27\lib\site-packages\IPython\frontend\terminal\ipapp.py",
> line 388, in launch_new_instance
>     app.initialize()   File "<string>", line 2, in initialize   File "C:\Python27\lib\site-packages\IPython\config\application.py", line
> 84, i n catch_config_error
>     return method(app, *args, **kwargs)   File "C:\Python27\lib\site-packages\IPython\frontend\terminal\ipapp.py",
> line 313, in initialize
>     super(TerminalIPythonApp, self).initialize(argv)   File "<string>", line 2, in initialize   File
> "C:\Python27\lib\site-packages\IPython\config\application.py", line
> 84, i n catch_config_error
>     return method(app, *args, **kwargs)   File …
Run Code Online (Sandbox Code Playgroud)

python ipython python-2.7

2
推荐指数
1
解决办法
6345
查看次数

Python列表作为列表索引

假设我们有两个列表

list_A = [1,3,4,54,3,5,6,2,6,77,73,39]
list_B = [0,3,2,8]
Run Code Online (Sandbox Code Playgroud)

我想访问list_A具有值list_B作为索引的元素(不使用循环).

实施后,上述情况的结果如下:

[1, 54, 4, 6]
Run Code Online (Sandbox Code Playgroud)

有没有简单的方法可以做到这一点而不必烦恼for循环(在代码中明确地调用它)?

python list

1
推荐指数
1
解决办法
2448
查看次数

使用HIdden Markov模型进行预测

假设有一系列观察,例如[1,2,3,5,5,5,2,3,2,3, ..., 3, 4].我试图在Scikit中使用HMM的当前实现 - 学习预测该观察序列的下一个值.我有2个问题.

  1. 给定一系列观察,我如何预测下一次观察(如上所述)?

  2. 鉴于n个观察的许多序列和那些序列的n + 1个观察,HMM可以用于预测n个观察的新序列的第(n + 1)个观察吗?如果是这样的话?

我从文档中无法理解这一点.

我发现可能有重复,但没有说明如何在Scikit中使用HMM - 学习预测序列中的下一个值.

machine-learning markov prediction hidden-markov-models scikit-learn

1
推荐指数
1
解决办法
1万
查看次数