小编Ham*_*UMB的帖子

无效的'asm':嵌套的汇编方言替代品

我正在尝试使用k1om-mpss-linux-gcc编译器为Xeon Phi平台编写一些带有KNC指令的内联汇编代码.我想在我的代码中使用掩码寄存器来向量化我的计算.这是我的代码:

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <sys/time.h>
#include <assert.h>
#include <stdint.h>

void* aligned_malloc(size_t size, size_t alignment) {

    uintptr_t r = (uintptr_t)malloc(size + --alignment + sizeof(uintptr_t));
    uintptr_t t = r + sizeof(uintptr_t);
    uintptr_t o =(t + alignment) & ~(uintptr_t)alignment;
    if (!r) return NULL;
    ((uintptr_t*)o)[-1] = r;
    return (void*)o;
}

int main(int argc, char* argv[])
{
    const int vectorSize = 16;
    int * n_arr = (int *) aligned_malloc(16 * sizeof(int),64);
    int * lenS_arr = (int *) aligned_malloc(16 …
Run Code Online (Sandbox Code Playgroud)

assembly gcc inline-assembly xeon-phi avx512

4
推荐指数
1
解决办法
329
查看次数

无法找到与基本名称相对应的 Bowtie 索引

我是领结新手。我正在尝试使用 Bowtie 进行端到端本地对齐。我收到此错误消息:

Could not locate a Bowtie index corresponding to basename "/bowtie2-index/hg19"
Run Code Online (Sandbox Code Playgroud)

在我的安装中,bowtie2-index/hg19 文件夹中有六个 bt2 文件。我正在使用以下命令:

/opt/bowtie2/bowtie2-align-s --wrapper basic-0 -p 64 -x /mnt/miczfs/tide/bowtie2-index/hg19 -S /mnt/miczfs/tide/Data/chr2chr3/chr2chr3.sam -1 /mnt/miczfs/tide/Data/chr2chr3/chr2chr3.f1.fastq -2 /mnt/miczfs/tide/Data/chr2chr3/chr2chr3.f2.fastq
Run Code Online (Sandbox Code Playgroud)

linux bioinformatics alignment

4
推荐指数
1
解决办法
6500
查看次数

无效的设备符号 cudaMemcpyFromSymbol CUDA

我想计算 CUDA 中数组所有元素的总和。我想出了这个代码。它编译没有任何错误。但结果始终为零。我从cudaMemcpyFromSymbol. 我不能使用任何库,如 Thrust 或 Cublas。

#define TRIALS_PER_THREAD 4096
#define NUM_BLOCKS 256
#define NUM_THREADS 256
double *dev;
__device__ volatile double pi_gpu = 0;

__global__ void ArraySum(double *array)

{
unsigned int tid = threadIdx.x + blockDim.x * blockIdx.x;
pi_gpu = pi_gpu + array[tid];
__syncthreads();
}

int main (int argc, char *argv[]) {
cudaMalloc((void **) &dev, NUM_BLOCKS * NUM_THREADS * sizeof(double));
    double pi_gpu_h;

ArraySum<<<NUM_BLOCKS, NUM_THREADS>>>(dev);
cudaDeviceSynchronize();
cudaError err = cudaMemcpyFromSymbol(&pi_gpu_h, &pi_gpu, sizeof(double), cudaMemcpyDeviceToHost);
if( cudaSuccess != err )
{ …
Run Code Online (Sandbox Code Playgroud)

cuda sum reduction

2
推荐指数
1
解决办法
740
查看次数

设置在CUDA中调用设备功能时的块和线程数?

我有一个关于从全局CUDA内核调用设备功能的基本问题。我想调用设备函数时可以指定块和线程的数量吗???

我在前面发布了一个关于最小缩减的问题(在此处),我想在另一个全局内核中调用此函数。但是,归约代码需要某些块和线程。

cuda

0
推荐指数
1
解决办法
885
查看次数

Hadoop减少输入记录= 0

我是Hadoop的新手,我的map-reduce代码可以工作,但它不会产生任何输出.这是map-reduce的信息:

16/09/20 13:11:40 INFO mapred.JobClient: Job complete: job_201609081210_0078
16/09/20 13:11:40 INFO mapred.JobClient: Counters: 28
16/09/20 13:11:40 INFO mapred.JobClient:   Map-Reduce Framework
16/09/20 13:11:40 INFO mapred.JobClient:     Spilled Records=0
16/09/20 13:11:40 INFO mapred.JobClient:     Map output materialized bytes=1362
16/09/20 13:11:40 INFO mapred.JobClient:     Reduce input records=0
16/09/20 13:11:40 INFO mapred.JobClient:     Virtual memory (bytes)   snapshot=466248720384
16/09/20 13:11:40 INFO mapred.JobClient:     Map input records=852032443
16/09/20 13:11:40 INFO mapred.JobClient:     SPLIT_RAW_BYTES=29964
16/09/20 13:11:40 INFO mapred.JobClient:     Map output bytes=0
16/09/20 13:11:40 INFO mapred.JobClient:     Reduce shuffle bytes=1362
16/09/20 13:11:40 INFO mapred.JobClient:     Physical …
Run Code Online (Sandbox Code Playgroud)

java hadoop mapreduce reducers mapper

0
推荐指数
1
解决办法
550
查看次数