小编sem*_*teu的帖子

如何在Bash中逐行合并两个文件

我有两个文本文件,每个文件都包含一行信息

file1.txt            file2.txt
----------           ---------
linef11              linef21
linef12              linef22
linef13              linef23
 .                    .
 .                    .
 .                    .
Run Code Online (Sandbox Code Playgroud)

我想使用bash脚本逐行合并这些文件,以获得:

fileresult.txt
--------------
linef11     linef21
linef12     linef22
linef13     linef23
 .           .
 .           .
 .           .
Run Code Online (Sandbox Code Playgroud)

怎么能在Bash中完成?

unix bash

164
推荐指数
5
解决办法
12万
查看次数

如何在C中声明和使用10亿个整数的庞大数组?

我正在实现一个顺序程序,像quicksort一样进行排序.我想用大量的1或10亿个整数来测试我的程序的性能.但问题是由于数组的大小,我得到了分段错误.

此数组声明的示例代码:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#define N 1000000000

int main(int argc, char **argv)
{
  int list[N], i;
  srand(time(NULL));
  for(i=0; i<N; i++)
     list[i] = rand()%1000;
  return 0;
}
Run Code Online (Sandbox Code Playgroud)

我有一个使用mmap函数的命题.但我不知道如何使用它?任何人都可以帮我使用它吗?

我正在研究Ubuntu 10.04 64位,gcc 4.4.3版.

谢谢你的回复.

c memory-management

14
推荐指数
2
解决办法
3万
查看次数

如何知道我的代码运行在哪个物理处理器和哪个物理核心上

我如何知道在C程序中,我的代码运行在哪个物理处理器和核心上?我正在使用Linux和gcc 4.4.3.

c linux system processor

6
推荐指数
2
解决办法
2651
查看次数

通过ALS获得错误的建议

我写了一个火花程序来提出建议。然后,我使用了ALS.recommendation库。然后,我对以下名为trainData的数据集进行了小型测试:

(u1, m1, 1)
(u1, m4, 1)
(u2, m2, 1)
(u2, m3, 1)
(u3, m1, 1)
(u3, m3, 1)
(u3, m4, 1)
(u4, m3, 1)
(u4, m4, 1)
(u5, m2, 1)
(u5, m4, 1)
Run Code Online (Sandbox Code Playgroud)

第一列包含用户,第二列包含用户评分的项目,第三列包含评分。

在用scala编写的代码中,我使用以下方法训练了模型:

myModel = ALS.trainImplicit(trainData, 3, 5, 0.01, 1.0)
Run Code Online (Sandbox Code Playgroud)

我尝试使用以下说明为u1检索一些建议:

recommendations = myModel.recommendProducts(idUser, 2)
Run Code Online (Sandbox Code Playgroud)

其中,idUser包含受影响的用户u1的ID。 作为建议,我获得:

(u1, m1, 1.0536233346170754)
(u1, m4, 0.8540954252858661)
(u1, m3, 0.09069877419040584)
(u1, m2, -0.1345521479521654)
Run Code Online (Sandbox Code Playgroud)

如您所见,前两行显示推荐的项目是u1已经评级的项目(m1和m4)。无论我选择获得推荐的用户是什么,我总是会得到相同的行为(推荐的第一个项目是用户已经评分的项目)。

我觉得很奇怪!哪里有问题吗?

recommendation-engine machine-learning collaborative-filtering apache-spark apache-spark-mllib

5
推荐指数
1
解决办法
550
查看次数

在opencl中使用自定义结构

我正在尝试使用OpenCL内核的自定义数据结构.我在宿主程序中定义了一个简单的结构,如:

struct myStruct{
   cl_ulong n_occ;
   cl_ulong start_time;
   cl_ulong end_time;
   cl_ulong exec_time;
   cl_ulong total_time;
   cl_float avg_time;
} myStruct_t;
Run Code Online (Sandbox Code Playgroud)

等效的自定义数据结构定义也在我的OpenCL内核中完成.

struct myStruct{
   unsigned long n_occ;
   unsigned long start_time;
   unsigned long end_time;
   unsigned long exec_time;
   unsigned long total_time;
   float avg_time;
} myStruct_t;
Run Code Online (Sandbox Code Playgroud)

内核函数如下:

__kernel void process_data( __global myStruct_t* input, __global myStruct_t* output){
    output->start_time = input->start_time;
    output->end_time = input->end_time;
    output->exec_time = input->end_time - input->start_time;
    output->total_time = input->total_time + output->exec_time;
    output->n_occ = input->n_occ + 1;
    output->avg_time = output->total_time / output->n_occ;
}
Run Code Online (Sandbox Code Playgroud)

我使用Nvidia卡作为GPU设备.执行内核代码后,我得到了错误的结果.我不明白原因.有什么东西不见了吗?

预先感谢您的帮助.

opencl data-structures

3
推荐指数
1
解决办法
1878
查看次数