我注意到,当在特定数据集(矩阵)上使用One Hot编码并将其用作学习算法的训练数据时,与使用原始矩阵本身作为训练数据相比,它在预测准确性方面提供了明显更好的结果.这种性能提升如何发生?
可能重复:
numpy:按列访问数组
我有一个numpy数组(numpy导入为np)
gona = np.array([[ 1, 2, 3],
[ 4, 5, 6],
[ 7, 8, 9],
[10, 11, 12]])
Run Code Online (Sandbox Code Playgroud)
我可以通过gona [1] [:]得到第1行整列的值.
数组([4,5,6])
但是如果我尝试获取所有行的特定列的所有值(比如我想要每行中第1列的值),我会尝试gona [:] [1].但是我得到的结果和以前一样.
这可能是什么原因?我怎么在numpy做这样的事情?
我们可以写一下(这里应该编辑)并使用csv库在Python中同时读取相同的csv文件吗?
可以打开csv文件进行编辑和追加吗?
如果是这样,怎么样?
我正在尝试使用python中的csv模块处理从csv文件获取的数据.这里有大约50列和401125行.我使用以下代码块将该数据放入列表中
csv_file_object = csv.reader(open(r'some_path\Train.csv','rb'))
header = csv_file_object.next()
data = []
for row in csv_file_object:
data.append(row)
Run Code Online (Sandbox Code Playgroud)
我可以使用len(数据)获取此列表的长度并返回401125.我甚至可以通过调用列表索引来获取每个单独的记录.但是当我尝试通过调用np.size(data)来获取列表的大小时(我将numpy导入为np),我获得了以下堆栈跟踪.
MemoryError Traceback(最近一次调用last)in()----> 1 np.size(data)
C:\ Python27\lib\site-packages \numpy\core\fromnumeric.pyc in size(a,axis)2198返回a.size 2199除AttributeError: - > 2200返回asarray(a).size 2201 else:2202试试:
asarray中的C:\ Python27\lib\site-packages \numpy\core \numeric.pyc(a,dtype,order)233 234""" - > 235返回数组(a,dtype,copy = False,order = order )236 237 def asanyarray(a,dtype = None,order = None):
的MemoryError:
我甚至无法使用列表索引将该列表分成多个部分或将此列表转换为numpy数组.它给出了同样的内存错误.
我该如何处理这种大数据样本.有没有其他方法来处理像这样的大型数据集.
我在Windows 7专业版中使用ipython笔记本.
如何在Java中使用Python中的观察者/可观察设施编写程序?我会在Java中写下类似的东西.
import java.util.Observable;
import java.util.Observer;
public class ObservDemo extends Object {
MyView view;
MyModel model;
public ObservDemo() {
view = new MyView();
model = new MyModel();
model.addObserver(view);
}
public static void main(String[] av) {
ObservDemo me = new ObservDemo();
me.demo();
}
public void demo() {
model.changeSomething();
}
/** The Observer normally maintains a view on the data */
class MyView implements Observer {
/** For now, we just print the fact that we got notified. */
public void update(Observable obs, …
Run Code Online (Sandbox Code Playgroud) 我试着运行IPython笔记本.我在命令行中输入了以下内容:
ipython笔记本
我收到以下错误(堆栈跟踪)
> Traceback (most recent call last): File
> "C:\Python27\Scripts\ipython-script.py", line 9, in <module>
> load_entry_point('ipython==0.13.1', 'console_scripts', 'ipython')() File
> "C:\Python27\lib\site-packages\IPython\frontend\terminal\ipapp.py",
> line 388, in launch_new_instance
> app.initialize() File "<string>", line 2, in initialize File "C:\Python27\lib\site-packages\IPython\config\application.py", line
> 84, i n catch_config_error
> return method(app, *args, **kwargs) File "C:\Python27\lib\site-packages\IPython\frontend\terminal\ipapp.py",
> line 313, in initialize
> super(TerminalIPythonApp, self).initialize(argv) File "<string>", line 2, in initialize File
> "C:\Python27\lib\site-packages\IPython\config\application.py", line
> 84, i n catch_config_error
> return method(app, *args, **kwargs) File …
Run Code Online (Sandbox Code Playgroud) 假设我们有两个列表
list_A = [1,3,4,54,3,5,6,2,6,77,73,39]
list_B = [0,3,2,8]
Run Code Online (Sandbox Code Playgroud)
我想访问list_A
具有值list_B
作为索引的元素(不使用循环).
实施后,上述情况的结果如下:
[1, 54, 4, 6]
Run Code Online (Sandbox Code Playgroud)
有没有简单的方法可以做到这一点而不必烦恼for
循环(在代码中明确地调用它)?
假设有一系列观察,例如[1,2,3,5,5,5,2,3,2,3, ..., 3, 4]
.我试图在Scikit中使用HMM的当前实现 - 学习预测该观察序列的下一个值.我有2个问题.
给定一系列观察,我如何预测下一次观察(如上所述)?
鉴于n个观察的许多序列和那些序列的n + 1个观察,HMM可以用于预测n个观察的新序列的第(n + 1)个观察吗?如果是这样的话?
我从文档中无法理解这一点.
我发现可能有重复,但没有说明如何在Scikit中使用HMM - 学习预测序列中的下一个值.
machine-learning markov prediction hidden-markov-models scikit-learn
python ×6
python-2.7 ×4
numpy ×2
scikit-learn ×2
csv ×1
data-mining ×1
ipython ×1
list ×1
markov ×1
prediction ×1