小编Hai*_*ang的帖子

如何获得cuda版本？

是否有任何快速命令或脚本来检查安装的CUDA版本？

我在安装目录下找到了4.0的手册,但我不确定它是否是实际安装的版本.

cuda

Hai*_*ang

2018 11-17

390
推荐指数

16
解决办法

73万
查看次数

一种快速查找numpy数组中最大N个元素的方法

我知道我可以像下面这样做:

import numpy as np
N=10
a=np.arange(1,100,1)
np.argsort()[-N:]

Run Code Online (Sandbox Code Playgroud)

然而,由于它做了一个完整的排序,它非常慢.

我想知道numpy是否提供了一些快速的方法.

python sorting numpy

Hai*_*ang

lucky-day

43
推荐指数

5
解决办法

4万
查看次数

如何在gdb中列出当前上下文中的所有变量？

在gdb中,在到达断点之后,我想列出当前上下文中的所有变量,而不是显式给出每个变量名称？有没有办法实现这一点？

gdb

Hai*_*ang

lucky-day

43
推荐指数

1
解决办法

4万
查看次数

"sys.getsizeof(int)"返回一个不合理的大值？

我想在python中检查int数据类型的大小:

import sys
sys.getsizeof(int)

Run Code Online (Sandbox Code Playgroud)

它出来是"436",这对我来说没有意义.无论如何,我想知道在我的机器上将占用多少字节(2,4,...？)int.

python

Hai*_*ang

2012 04-29

36
推荐指数

1
解决办法

3万
查看次数

cudaStreamSynchronize vs CudaDeviceSynchronize vs cudaThreadSynchronize

这三个功能有什么区别,尤其是后两个功能？图书馆手册说

请注意,不推荐使用此函数,因为其名称不反映其行为.它的功能类似于非弃用函数cudaDeviceSynchronize(),应该使用它.

但不太确定它是什么意思.

cuda

Hai*_*ang

2012 11-21

24
推荐指数

1
解决办法

2万
查看次数

如何在python中检查float的大小？

我想检查浮点数实际上是32位还是64位(以及numpy浮点数组的位数).应该有一个内置的,但只是没有发现...

python numpy

Hai*_*ang

2011 11-22

23
推荐指数

4
解决办法

5万
查看次数

如何使负数的mod变为正数？

基本上,我需要(-3) % 5是"2"而不是"-3".Python产生"2",但C++产生"-3".不知道如何在C++中生成"2".谢谢!

c++

Hai*_*ang

2012 12-10

20
推荐指数

3
解决办法

1万
查看次数

为什么sys.getrefcount()返回2？

据我所知,sys.getrefcount()返回一个对象的引用数,在下列情况下"应该"为1:

import sys,numpy
a = numpy.array([1.2,3.4])
print sys.getrefcount(a)

Run Code Online (Sandbox Code Playgroud)

然而,事实证明是2!所以,如果我:

del a

Run Code Online (Sandbox Code Playgroud)

"numpy.array([1.2,3.4])"对象是否仍然存在(没有垃圾收集)？

python garbage-collection

Hai*_*ang

2017 10-10

18
推荐指数

1
解决办法

4677
查看次数

关闭上/右轴刻度线

我想让右轴和上轴的刻度不可见,我不确定第三行应该是什么:

import matplotlib.pyplot as plt
plt.plot(X,Y)
#plt.upper_right_axis_ticks_off()

Run Code Online (Sandbox Code Playgroud)

python matplotlib

Hai*_*ang

2018 04-03

17
推荐指数

3
解决办法

2万
查看次数

我需要进行矩阵 - 矩阵乘法(A(n*k)*B(k*n)),但我只需要对输出矩阵求对角元素.我搜索了cublas库,并没有找到任何能够做到这一点的2级或3级功能.所以,我决定将A的每一行和B的每一列分配到CUDA线程中.对于每个线程(idx),我需要计算点积"A [idx,:]*B [:,idx]"并将其保存为相应的对角线输出.现在因为这个点产品也需要一些时间,我想知道我是否可以在某种程度上调用cublas函数(比如cublasSdot)来实现它.

如果我错过了一些可以直接实现我的目标的cublas函数(只计算矩阵 - 矩阵乘法的对角元素),这个问题可能会被丢弃.

cuda gpu cublas

Hai*_*ang

2013 02-11

16
推荐指数

1
解决办法

5771
查看次数