小编whi*_*ile的帖子

如何在R中有效地实现合并

背景

几种SQL语言(我主要使用postgreSQL)有一个名为coalesce的函数,它返回每行的第一个非空列元素.当表中包含大量NULL元素时,这可以非常有效地使用.

我在R中的许多场景中都遇到过这种情况,当处理不太结构化的数据时,其中包含很多NA.

我自己做了一个天真的实现,但它的速度非常慢.

coalesce <- function(...) {
  apply(cbind(...), 1, function(x) {
          x[which(!is.na(x))[1]]
        })
}

Run Code Online (Sandbox Code Playgroud)

例

a <- c(1,  2,  NA, 4, NA)
b <- c(NA, NA, NA, 5, 6)
c <- c(7,  8,  NA, 9, 10)
coalesce(a,b,c)
# [1]  1  2 NA  4  6

Run Code Online (Sandbox Code Playgroud)

题

coalesce在R中有没有有效的方法？

r coalesce

whi*_*ile

2017 10-19

37
推荐指数

6
解决办法

2万
查看次数

有没有办法在matlab中使用hashtables/hashmaps？

可能重复:
MATLAB中的哈希表

一般问题

有没有办法在Matlab中获取hashset或hashmap结构？

我经常发现自己处于需要查找唯一条目或检查向量成员资格并使用命令unique()或逻辑索引的情况下搜索向量并且对于大型值集合来说非常慢.在Matlab中执行此操作的最佳方法是什么？

例

比如说,我有一个素数列表,并想检查3是否为素数:

primes = [2,3,5,7,11,13];

if primes(primes==3)
    disp('yes!')
else
    disp('no!')
end

Run Code Online (Sandbox Code Playgroud)

如果我用长向量做这个,很多时候事情变得很慢.

在其他语言中

所以基本上,是否有任何等效的python set()和dict(),或类似的Java java.util.HashSet和java.util.HashMapMatlab？如果没有,有没有什么好的方法在大型向量中进行查找？

编辑:对答案的反思

这是我在答案中得到建议的运行时间.

>> b = 1:1000000;
>> tic; for i=1:100000, any(b==i);; end; toc
Elapsed time is 125.925922 seconds.

s = java.util.HashSet();
>> for i=1:1000000, s.add(i); end    
>> tic; for i=1:100000, s.contains(i); end; toc
Elapsed time is 25.618276 seconds.

>> m = containers.Map(1:1000000,ones(1,1000000));
>> tic; for i=1:100000, m(i); end; toc
Elapsed time …

Run Code Online (Sandbox Code Playgroud)

matlab data-structures

whi*_*ile

2017 05-23

15
推荐指数

1
解决办法

1万
查看次数

python 3中最快的stdin/out IO？

我一直在使用python 3.1.2在SPOJ.pl上解决一些问题,而一些人快速导致简单的问题让我想知道是否有更快的方法来处理输入和输出.

我试过用了

input()
print()

Run Code Online (Sandbox Code Playgroud)

和

sys.stdin.readline()
sys.stdout.write()

Run Code Online (Sandbox Code Playgroud)

更确切地说

for line in sys.stdin:
    #Handle input
    sys.stdout.write(output)

Run Code Online (Sandbox Code Playgroud)

处理每一行.我还尝试收集列表中的所有输出,并在处理完所有内容时立即打印.

但所有这些都会产生类似的执行时间.

有没有更快的方法来处理stdin/out的输入和输出？

python io performance stdin python-3.x

whi*_*ile

lucky-day

14
推荐指数

1
解决办法

2万
查看次数

使用逻辑或组合列表中的逻辑向量

题

如何在列表中有效地组合列表中的逻辑向量,or以便获得相同长度的向量？

例

我有一个列表opts与一组相同长度的逻辑向量.

> str(opts)
List of 7
 $ option1: logi [1:608247] FALSE FALSE FALSE FALSE FALSE FALSE ...
 $ option2: logi [1:608247] FALSE FALSE FALSE FALSE FALSE FALSE ...
 $ option3: logi [1:608247] FALSE FALSE FALSE FALSE FALSE FALSE ...
 $ option4: logi [1:608247] FALSE TRUE  FALSE TRUE  TRUE  TRUE  ...
 $ option5: logi [1:608247] FALSE TRUE  FALSE FALSE TRUE  FALSE ...
 $ option6: logi [1:608247] FALSE FALSE FALSE FALSE FALSE FALSE ...
 $ option7: logi …

Run Code Online (Sandbox Code Playgroud)

whi*_*ile

lucky-day

12
推荐指数

2
解决办法

7493
查看次数

有没有办法在Android中明确控制WiFi扫描间隔？

我目前在WiFi定位上做硕士论文,为了测试我的算法,我需要收集一些数据.

为此,我编写了一个简短而简单的Android程序,它只是为每次扫描找到的所有可用访问点收集RSSI并将它们保存到文件中.我已经设置了一个BroadcastReceiver侦听事件WifiManager.SCAN_RESULTS_AVAILABLE_ACTION,我使用一个Timer名为tim的,用一个WifiManager叫做wifi的扫描来启动扫描,如下所示:

tim.schedule(new TimerTask(){
        @Override
        public void run(){
            wifi.startScan();
        }
}, 0, 1000);

Run Code Online (Sandbox Code Playgroud)

我现在遇到的问题是,即使我成功启动它们,启动的扫描似乎也不会每秒都发生,并且偶尔会有其他扫描从其他应用程序启动并进行记录.

是否有任何简单的方法可以在设定的时间间隔内扫描而不接收其他应用程序发起的扫描？

整个应用程序可以在https://github.com/while/RSSIMiner上找到,如果它有任何帮助.

android rssi android-wifi

whi*_*ile

lucky-day

9
推荐指数

1
解决办法

7170
查看次数

如何从javascript中获取Rhino的版本？

有没有办法在正在解释的javascript中获取当前版本的Rhino？

javascript rhino

whi*_*ile

lucky-day

4
推荐指数

1
解决办法

2253
查看次数

如何在铁路由器中获取模板的路径

如何在Meteor 1.0的新版铁路由器中获取模板的路径？

在我这样做之前获取当前的相对路径:

Router.current().path

Run Code Online (Sandbox Code Playgroud)

现在,从meteor 1.0开始,似乎已删除了path属性.

如何在铁路由器中获取模板的相对路径？

meteor iron-router

whi*_*ile

2014 10-29

4
推荐指数

1
解决办法

2766
查看次数

如何在Dataflow / Beam中的gcs中将结果写入JSON文件

我正在使用Python Beam SDK 0.6.0。我想将输出写入Google Cloud Storage中的JSON。做这个的最好方式是什么？

我可以WriteToText在Text IO接收器中使用，但是然后我必须分别格式化每一行，对吗？如何将结果保存到包含对象列表的有效JSON文件中？

python json google-cloud-storage google-cloud-dataflow apache-beam

whi*_*ile

2017 04-05

2
推荐指数

2
解决办法

2559
查看次数

Bigquery-如何将两个数组压缩为一个？

如果在BigQuery中有两个我知道大小相等的数组。我如何将它们压缩到一个结构数组或两个元素数组或类似数组中？

以下查询为我提供了x和y的所有可能组合，这不是我想要的。

WITH test AS (
  SELECT
    ['a', 'b', 'c'] as xs,
    [1, 2, 3] as ys
)
SELECT struct(x, y) as pairs 
FROM test, unnest(xs) as x, unnest(ys) as y

Run Code Online (Sandbox Code Playgroud)

我想得到这样的东西：

+--------+--------+
| pair.x | pair.y |
+--------+--------+
| a      | 1      |
| b      | 2      |
| c      | 3      |
+--------+--------+

Run Code Online (Sandbox Code Playgroud)

arrays google-bigquery

whi*_*ile

lucky-day

2
推荐指数

1
解决办法

523
查看次数

标签统计

python ×2

r ×2

android ×1

android-wifi ×1

apache-beam ×1

arrays ×1

coalesce ×1

data-structures ×1

google-bigquery ×1

google-cloud-dataflow ×1

google-cloud-storage ×1

io ×1

iron-router ×1

javascript ×1

json ×1

matlab ×1

meteor ×1

performance ×1

python-3.x ×1

rhino ×1

rssi ×1

stdin ×1

背景

例

题

一般问题

例

在其他语言中

编辑:对答案的反思

题

例

标签 统计

小编whi_ile的帖子

标签统计