小编Dee*_*pak的帖子

双下划线(__const)在C中意味着什么?

extern int ether_hostton (__const char *__hostname, struct ether_addr *__addr)
 __THROW;
Run Code Online (Sandbox Code Playgroud)

我在Linux机器上的/usr/include/netinet/ether.h中找到了上面的函数定义.

有人可以在const(关键字),addr(标识符)和最后__THROW前面解释双下划线的含义.

c syntax double-underscore

48
推荐指数
2
解决办法
4万
查看次数

Hadoop如何执行输入拆分?

这是一个涉及Hadoop/HDFS的概念性问题.假设您有一个包含10亿行的文件.并且为了简单起见,我们考虑每条线的形式<k,v>,其中k是从开头开始的线的偏移量,值是线的内容.

现在,当我们说要运行N个映射任务时,框架是否将输入文件拆分为N个拆分并在该拆分上运行每个映射任务?或者我们是否必须编写一个分区函数来执行N分割并在生成的分割上运行每个映射任务?

我想知道的是,拆分是在内部完成还是我们必须手动拆分数据?

更具体地说,每次调用map()函数时,它的Key key and Value val参数是什么?

谢谢,迪帕克

hadoop mapreduce hdfs

34
推荐指数
5
解决办法
5万
查看次数

UDP校验和计算

在/usr/include/netinet/udp.h中定义的UDP头结构如下

struct udphdr
{
  u_int16_t source;
  u_int16_t dest;
  u_int16_t len;
  u_int16_t check;
};
Run Code Online (Sandbox Code Playgroud)

标题的检查字段中存储了什么值?如何验证校验和是否正确?我的意思是校验和计算的数据是什么?(它只是udp头或udp头加上它后面的有效负载吗?)

谢谢.

c checksum udp network-programming

21
推荐指数
1
解决办法
8万
查看次数

hadoop中的全局变量

我的程序遵循迭代的map/reduce方法.如果满足某些条件,它需要停止.无论如何,我可以设置一个全局变量,可以分布在所有map/reduce任务中,并检查全局变量是否达到完成条件.

像这样的东西.

While(Condition != true){

            Configuration conf = getConf();
            Job job = new Job(conf, "Dijkstra Graph Search");

            job.setJarByClass(GraphSearch.class);
            job.setMapperClass(DijkstraMap.class);
            job.setReducerClass(DijkstraReduce.class);

            job.setOutputKeyClass(IntWritable.class);
            job.setOutputValueClass(Text.class);

}
Run Code Online (Sandbox Code Playgroud)

where条件是在每个map/reduce执行期间/之后修改的全局变量.

hadoop mapreduce

10
推荐指数
2
解决办法
2万
查看次数

用Java表示100K X 100K矩阵

如何在Java中存储100K X 100K矩阵?

我不能用正常的数组声明来做,因为它抛出了一个java.lang.OutofMemoryError.

java arrays

8
推荐指数
5
解决办法
3805
查看次数

使用Amazon EC2/S3在Hadoop集群上将本地数据复制到HDFS时出现问题

我在Amazon EC2上设置了一个包含5个节点的Hadoop集群.现在,当我登录主节点并提交以下命令时

bin/hadoop jar <program>.jar <arg1> <arg2> <path/to/input/file/on/S3>
Run Code Online (Sandbox Code Playgroud)

它抛出以下错误(不是同时出现.)当我不用'%2F'替换斜杠时抛出第一个错误,当我用'%2F'替换它时抛出第二个错误:

1) Java.lang.IllegalArgumentException: Invalid hostname in URI S3://<ID>:<SECRETKEY>@<BUCKET>/<path-to-inputfile>
2) org.apache.hadoop.fs.S3.S3Exception: org.jets3t.service.S3ServiceException: S3 PUT failed for '/' XML Error Message: The request signature we calculated does not match the signature you provided. check your key and signing method.
Run Code Online (Sandbox Code Playgroud)

注意:

1)当我提交jps以查看Master上正在运行的任务时,它只显示了

1116 NameNode
1699 Jps
1180 JobTracker
Run Code Online (Sandbox Code Playgroud)

离开DataNode和TaskTracker.

2)我的密钥包含两个'/'(正斜杠).我用S3 URI中的'%2F'替换它们.

PS:在单个节点上运行时,程序在EC2上运行正常.只有当我启动集群时,才会遇到与从/向HDFS复制数据到/从S3复制数据的问题.而且,distcp做了什么?即使我将数据从S3复制到HDFS,我是否需要分发数据?(我想,HDFS在内部负责处理)

如果您可以引导我使用Amazon EC2/S3解释在hadoop集群上运行Map/reduce程序的链接.那太好了.

问候,

迪帕克.

cloud hadoop amazon-s3 amazon-ec2 hdfs

8
推荐指数
2
解决办法
8492
查看次数

使用JavaScript库的社交网络图

我打算画一个有向图(面向节点).图中的节点是动态生成的.我想知道是否有任何好的js库可以解决我的问题.边缘和权重需要自定义配置.

谢谢,迪帕克.

javascript graph social-networking

7
推荐指数
1
解决办法
1万
查看次数

调试hadoop应用程序

我尝试使用System.out.println()打印出值,但它们不会出现在控制台上.如何使用Hadoop打印map/reduce应用程序中的值以进行调试?

谢谢,迪帕克.

hadoop mapreduce

7
推荐指数
2
解决办法
5434
查看次数

用于图像分割的C++库

我将在数据挖掘中进行与图像聚类相关的项目(在C++中).我正在寻找一个强大的库,它有助于图像处理,线性代数和3D图形.有什么想法吗?

谢谢.

c++ 3d image-processing linear-algebra

6
推荐指数
1
解决办法
4047
查看次数

如何使用Perl动态获取Web内容?

这有点棘手.我猜这个网页使用某种AJAX来根据搜索查询提取内容.当我使用get in Perl获取页面时,它会获取php/html后面的脚本代码,但不会获取手动搜索查询时显示的结果.我需要能够获取结果页面的内容.反正在Perl中有没有这样做?

javascript ajax perl

2
推荐指数
1
解决办法
2742
查看次数

无法在Windows上安装XML :: LibXML模块

我试图用来XPath提取一些HTML标签和数据,为此我需要使用XML::LibXML模块.

我尝试从CPAN shell安装它,但它没有安装.

我按照CPAN网站上有关安装的说明,我们需要安装libxml2,iconv以及zlib在安装之前的包装器XML::LibXML,它没有用完.

此外,如果还有其他更简单的模块可以完成我的任务,请告诉我.

手头的任务:

<dd>在html页面上搜索特定的标签,这个标签非常大(大约5000 - 10000)<dd><dt>标签.所以,我正在编写一个匹配<dd>标记内容的脚本,并获取相应(下一个)<dt>标记内的内容.

我希望我能更清楚一点.任何帮助是极大的赞赏.

windows perl xpath cpan xml-libxml

1
推荐指数
1
解决办法
3721
查看次数

指针数组初始化

 char **arr;
 arr = (char **)calloc(1,sizeof(char*));

 for(i = 0; i< 16; i++)
    if(arr[i] = (char *)calloc(1, 2*sizeof(char)) == NULL)
        perror("Memory cannot be allocated to arr[i]", %d);
Run Code Online (Sandbox Code Playgroud)

当我尝试将内存分配给arr [i]时,上面的代码在for循环中抛出一个错误.这个分配有什么问题.本质上,我想存储16个长度为2的字符串.我也尝试过使用指针数组(char*arr [16]).我尝试使用malloc()和calloc()查找双指针初始化的资源,但找不到很多.如果你能指出一些链接,那将非常感激.谢谢.

c pointers

1
推荐指数
2
解决办法
1万
查看次数