小编Ste*_*onà的帖子

Python numpy数组numpy数组

我在创建一个numpy数组的numpy数组时遇到了问题.我会在循环中创建它:

a=np.array([])
while(...):
   ...
   b= //a numpy array generated
   a=np.append(a,b)
   ...
Run Code Online (Sandbox Code Playgroud)

期望的结果:

[[1,5,3], [9,10,1], ..., [4,8,6]]
Run Code Online (Sandbox Code Playgroud)

真实结果:

[1,5,3,9,10,1,... 4,8,6]
Run Code Online (Sandbox Code Playgroud)

可能吗?我不知道数组的最终维度,所以我不能用固定的维度初始化它.

python arrays numpy

13
推荐指数
2
解决办法
3万
查看次数

将 CUDA nvprof 输出导出到 Visual Profiler

我想从我的 GPU 应用程序中提取数据以检查其限制。我必须使用nvprof因为该应用程序在远程服务器上运行,所以我应该创建一个文件以在Visual Profiler 中本地导入。我尝试使用nvprof -o file_name <app> <params>和来创建文件,nvprof --analysis-metrics --output-profile file_name <app> <params>但是当我在 Visual Profiler 上导入这些文件时,在分析部分中,某些字段为空:“全局内存加载数据不足”、“全局内存存储数据不足”、“内核不足” SM数据”.... 我怎样才能生成一个文件(或更多)以获得分析部分的所有信息?我用带有标志的nvcc编译 cuda 代码-lineinfo -arch compute_20 -code sm_20 --ptxas-options=-v。这些是空字段的一些示例:在此处输入图片说明

cuda nvvp nvprof

6
推荐指数
1
解决办法
5027
查看次数

Android 旋转矢量传感器和旋转矩阵

我是旋转矩阵领域的新手,我试图了解旋转矢量传感器的行为。我无法理解 yaw、pith 和 roll 与旋转矢量传感器返回的值之间的关系。

我在这里检查了SensorManager.getRotationMatrixFromVector() 的源代码和Android 文档。旋转矢量传感器返回以下值:

values[0]: x*sin(?/2)
values[1]: y*sin(?/2)
values[2]: z*sin(?/2)
values[3]: cos(?/2)
values[4]: estimated heading Accuracy (in radians) (-1 if unavailable)
Run Code Online (Sandbox Code Playgroud)

来自文档:“设备已围绕轴 (x, y, z) 旋转了一个角度?”。所以我现在的问题是,什么是?什么是 x、y 和 z?遵循OpenGL 文档中的教程,要旋转矢量 VI 需要使用我构建旋转矩阵的 pith、roll 和 yaw 值。最后,我必须将此矩阵乘以 V 以旋转向量。如果我是对的,这个矩阵不同于与使用SensorManager.getRotationMatrixFromVector()获得的向量相关的矩阵。我对吗?那么什么代表那个矩阵呢?

android opengl-es rotational-matrices android-sensors

5
推荐指数
0
解决办法
1216
查看次数

使用Keras神经网络进行GridSearch

我正在尝试为使用keras构建的神经网络执行参数调整。这是我的代码,在引起错误的行上带有注释:

from sklearn.cross_validation import StratifiedKFold, cross_val_score
from sklearn import grid_search
from sklearn.metrics import classification_report
import multiprocessing

from keras.models import Sequential
from keras.layers import Dense
from sklearn.preprocessing import LabelEncoder
from keras.utils import np_utils
from keras.wrappers.scikit_learn import KerasClassifier
import numpy as np


def tuning(X_train,Y_train,X_test,Y_test):

  in_size=X_train.shape[1]
  num_cores=multiprocessing.cpu_count()
  model = Sequential()
  model.add(Dense(in_size, input_dim=in_size, init='uniform', activation='relu'))
  model.add(Dense(8, init='uniform', activation='relu'))
  model.add(Dense(1, init='uniform', activation='sigmoid'))
  model.compile(loss='binary_crossentropy', optimizer='adam', metrics=['accuracy'])

  batch_size = [10, 20, 40, 60, 80, 100]
  epochs = [10,20]
  param_grid = dict(batch_size=batch_size, nb_epoch=epochs)

  k_model = KerasClassifier(build_fn=model, verbose=0)
  clf …
Run Code Online (Sandbox Code Playgroud)

python machine-learning keras

5
推荐指数
1
解决办法
7379
查看次数

CUDA atomics causes branch divergence

我正在开发一个 CUDA 内核来计算图像的直方图(NVIDIA GTX 480)。我注意到使用 cuda profiler 发现了 82.2% 的分支分歧。分析器将以下函数指示为差异源,该函数位于名为device_functions.h的文件中(特别是包含 return 语句的行)。

static __forceinline__
unsigned int __uAtomicAdd(unsigned int *p, unsigned int val)
{
  return __nvvm_atom_add_gen_i((volatile int *)p, (int)val);
}
Run Code Online (Sandbox Code Playgroud)

原子操作导致分支发散的说法正确吗?

profiler cuda atomic nvidia

2
推荐指数
1
解决办法
371
查看次数