小编pra*_*nay的帖子

在猪拉丁语中为foreach生成一个id/counter

我希望在我的foreach构造中生成/附加某种唯一标识符/ line_number/counter,同时遍历记录.有没有办法在不编写UDF的情况下实现这一目标?

B = foreach A生成a_unique_id,field1,...等

我如何实现'a_unique_id'?

谢谢!

apache-pig

6
推荐指数
1
解决办法
3449
查看次数

php中callable的使用

我试图在下面的实现中模仿 php 的内置 usort 函数定义:

class heapSort {
    static function hsort(array &$array, callable $cmp_function){
       // logic
    }
}

class utility{
    static function mycomparator(){
        // logic
    }
}

$array = array(5,3,8,1);
$callback = array('utility','mycomparator');
heapSort::hsort($array, $callback);
Run Code Online (Sandbox Code Playgroud)

虽然变量$callback是“可调用的”,但为什么我会遇到致命错误?

传递给 heapSort::hsort() 的参数 2 必须是 callable 的实例。

更具体地说,我如何制作/类型转换$variable为可调用的?

php callable

4
推荐指数
1
解决办法
5475
查看次数

特定文件处理需要的数据结构选择 - java

我查找了类似于我的问题,但我正在寻找在java内置数据结构的约束下的最佳解决方案.

我有两个纯文本文件.虽然file1有一个用户名列表,但file2有来自这些用户和其他用户的推特帖子.Twitter帖子只是作为文本中的纯文本推送.

对于每个用户,如果存在帖子,我必须提取帖子中使用的所有不同的主题标签(假设主题标签是整数,每个帖子被限制在一行).

这是我选择的数据结构

Map<String, LinkedHashSet<Integer>> usernames = new HashMap<>();
Run Code Online (Sandbox Code Playgroud)

我解决问题的方法

  1. 读取file1以填充用户名键,将默认值设置为null.
  2. 按顺序读取file2,类似post = file2.readLine()
  3. 如果在hashMap键中找到帖子中的用户名,请将帖子中发现的所有主题标签添加到值Set中.

这种方法和数据结构对于一百万用户(f​​ile1)和1000万个帖子(file2)来说听起来像是一个好方法吗?

java performance file-io data-structures

2
推荐指数
1
解决办法
248
查看次数