标签: numpy

如何使用python/numpy计算百分位数?

有没有一种方便的方法来计算序列或单维numpy数组的百分位数?

我正在寻找类似于Excel的百分位函数的东西.

我查看了NumPy的统计参考,但是找不到这个.我能找到的只是中位数(第50百分位数),但不是更具体的东西.

python statistics numpy percentile numpy-ndarray

193
推荐指数
7
解决办法
24万
查看次数

如何将numpy数组转换为(并显示)图像?

我这样创建了一个数组:

import numpy as np
data = np.zeros( (512,512,3), dtype=np.uint8)
data[256,256] = [255,0,0]
Run Code Online (Sandbox Code Playgroud)

我想要做的是在512x512图像的中心显示一个红点.(至少从...开始......我想我可以从中找出其余部分)

python arrays numpy data-visualization image

191
推荐指数
7
解决办法
34万
查看次数

将索引数组转换为1-hot编码的numpy数组

假设我有一个ndy阵列

a = array([1,0,3])
Run Code Online (Sandbox Code Playgroud)

我想将其编码为2d 1-hot阵列

b = array([[0,1,0,0], [1,0,0,0], [0,0,0,1]])
Run Code Online (Sandbox Code Playgroud)

有快速的方法吗?比仅仅循环a设置元素更快b.

python numpy machine-learning one-hot-encoding numpy-ndarray

191
推荐指数
9
解决办法
15万
查看次数

ValueError:具有多个元素的数组的真值是不明确的.使用a.any()或a.all()

我刚刚在代码中发现了一个逻辑错误,导致了各种各样的问题.我无意中做了一个按位AND而不是逻辑AND.

我更改了代码:

r = mlab.csv2rec(datafile, delimiter=',', names=COL_HEADERS)
mask = ((r["dt"] >= startdate) & (r["dt"] <= enddate))
selected = r[mask]
Run Code Online (Sandbox Code Playgroud)

至:

r = mlab.csv2rec(datafile, delimiter=',', names=COL_HEADERS)
mask = ((r["dt"] >= startdate) and (r["dt"] <= enddate))
selected = r[mask]
Run Code Online (Sandbox Code Playgroud)

令我惊讶的是,我收到了相当神秘的错误消息:

ValueError:具有多个元素的数组的真值是不明确的.使用a.any()或a.all()

为什么在使用按位操作时没有发出类似的错误 - 我该如何解决这个问题?

python numpy

190
推荐指数
4
解决办法
51万
查看次数

从pandas中的数据帧中删除无限值?

什么是从pandas DataFrame中删除nan和inf/-inf值而不重置的最快/最简单的方法mode.use_inf_as_null?我希望能够使用subsethow参数dropna,除了inf被认为缺失的值,例如:

df.dropna(subset=["col1", "col2"], how="all", with_inf=True)
Run Code Online (Sandbox Code Playgroud)

这可能吗?有没有办法告诉dropnainf在其缺失值的定义中包含哪些内容?

python numpy scipy pandas

189
推荐指数
7
解决办法
19万
查看次数

从数组中删除nan值

我想弄清楚如何从我的数组中删除nan值.它看起来像这样:

x = [1400, 1500, 1600, nan, nan, nan ,1700] #Not in this exact configuration
Run Code Online (Sandbox Code Playgroud)

我对python比较陌生,所以我还在学习.有小费吗?

python arrays numpy nan

188
推荐指数
10
解决办法
31万
查看次数

Python中的Pandas和NumPy + SciPy有什么区别?

它们看起来非常相似,我很好奇哪种方案对财务数据分析更有利.

python numpy scipy pandas

187
推荐指数
2
解决办法
12万
查看次数

在Python中计算Pearson相关性和显着性

我正在寻找一个函数,它将两个列表作为输入,并返回Pearson相关性相关性的重要性.

python statistics numpy scipy

185
推荐指数
11
解决办法
34万
查看次数

在numpy.array中查找唯一的行

我需要找到一个独特的行numpy.array.

例如:

>>> a # I have
array([[1, 1, 1, 0, 0, 0],
       [0, 1, 1, 1, 0, 0],
       [0, 1, 1, 1, 0, 0],
       [1, 1, 1, 0, 0, 0],
       [1, 1, 1, 1, 1, 0]])
>>> new_a # I want to get to
array([[1, 1, 1, 0, 0, 0],
       [0, 1, 1, 1, 0, 0],
       [1, 1, 1, 1, 1, 0]])
Run Code Online (Sandbox Code Playgroud)

我知道我可以在阵列上创建一个集合并循环,但我正在寻找一个有效的纯numpy解决方案.我相信有一种方法可以将数据类型设置为void然后我可以使用numpy.unique,但我无法弄清楚如何使其工作.

python arrays numpy unique

185
推荐指数
9
解决办法
8万
查看次数

如何删除numpy数组中的特定元素

如何从numpy数组中删除一些特定元素?说我有

import numpy as np

a = np.array([1,2,3,4,5,6,7,8,9])
Run Code Online (Sandbox Code Playgroud)

然后我想删除3,4,7a.我所知道的是值(index=[2,3,6])的索引.

python arrays numpy

180
推荐指数
7
解决办法
39万
查看次数