小编Lis*_*isa的帖子

使用scipy的片面Wilcoxon符号排名测试

我想对我的配对数据执行单侧wilcoxon秩检验,因为我感兴趣的是一个样本明显大于另一个样本.

Scipy提供

scipy.stats.wilcoxon(x,y)
Run Code Online (Sandbox Code Playgroud)

使用配对样本x和y执行双侧测试.由于我不能假设正常(对称)分布,我不能从双侧p值导出单侧p值.

现在有人以python的方式获得单侧测试的p值吗?

谢谢!

python statistics scipy

14
推荐指数
1
解决办法
1万
查看次数

未知的python表达式filename = r'/ path/to/file'

我发现这个可能非常有用的python 脚本,但遇到了我以前从未见过的这些表达式:

inputfilename = r'/path/to/infile'
outputfilename = r'/path/to/outfile'
Run Code Online (Sandbox Code Playgroud)

我找不到搜索它的方法.这是r'...'做什么的?

谢谢你的帮助!

python string

10
推荐指数
1
解决办法
2万
查看次数

为什么numpy计算不受全局解释器锁的影响?

我正在尝试决定是否应该使用多处理或线程,并且我已经学习了一些有关Global Interpreter Lock的有趣内容.在这篇不错的博文中,似乎多线程不适合繁忙的任务.但是,我还了解到一些功能,如I/O或numpy,不受GIL的影响.

任何人都可以解释为什么,以及我如何能够找出我的(可能非常重的)代码是否适合多线程?

python multithreading numpy multiprocessing gil

10
推荐指数
1
解决办法
2219
查看次数

MATLAB识别3D图像中的邻接区域

我有一个3D图像,分为连续区域,每个体素具有相同的值.分配给该区域的值对于该区域是唯一的,并用作标签.下面的示例图片描述了2D案例:

     1 1 1 1 2 2 2
     1 1 1 2 2 2 3
Im = 1 4 1 2 2 3 3
     4 4 4 4 3 3 3
     4 4 4 4 3 3 3
Run Code Online (Sandbox Code Playgroud)

我想创建一个描述这些区域之间的相互关系的图表.在上面的例子中,这将是:

    0 1 0 1
A = 1 0 1 1
    0 1 0 1
    1 1 1 0
Run Code Online (Sandbox Code Playgroud)

我正在寻找一个快速的解决方案来在MATLAB中为大型3D图像执行此操作.我提出了一个迭代所有区域的解决方案,这需要0.05s每次迭代 - 不幸的是,对于具有32'000个区域的图像,这将花费半个多小时.现在有人有更优雅的方式吗?我发布了下面的当前算法:

labels = unique(Im); % assuming labels go continuously from 1 to N
A = zeros(labels);

for ii=labels
  % …
Run Code Online (Sandbox Code Playgroud)

performance matlab image-processing vectorization adjacency-matrix

5
推荐指数
1
解决办法
268
查看次数

我该如何处理巨大的矩阵?

我正在通过监督学习进行主题检测.但是,我的矩阵尺寸非常大(202180 x 15000),我无法将它们放入我想要的模型中.大多数矩阵由零组成.只有逻辑回归才有效.有没有办法让我可以继续使用相同的矩阵,但是让他们能够使用我想要的模型?我可以用不同的方式创建我的矩阵吗?

这是我的代码:

import numpy as np
import subprocess
from sklearn.linear_model import SGDClassifier
from sklearn.linear_model import LogisticRegression

from sklearn import metrics

def run(command):
    output = subprocess.check_output(command, shell=True)
    return output
Run Code Online (Sandbox Code Playgroud)

加载词汇

 f = open('/Users/win/Documents/wholedata/RightVo.txt','r')
    vocab_temp = f.read().split()
    f.close()
    col = len(vocab_temp)
    print("Training column size:")
    print(col)
Run Code Online (Sandbox Code Playgroud)

创建火车矩阵

row = run('cat '+'/Users/win/Documents/wholedata/X_tr.txt'+" | wc -l").split()[0]
print("Training row size:")
print(row)
matrix_tmp = np.zeros((int(row),col), dtype=np.int64)
print("Train Matrix size:")
print(matrix_tmp.size)

label_tmp = np.zeros((int(row)), dtype=np.int64)
f = open('/Users/win/Documents/wholedata/X_tr.txt','r')
count = 0
for line in …
Run Code Online (Sandbox Code Playgroud)

python machine-learning matrix

5
推荐指数
1
解决办法
91
查看次数

更改anaconda中的默认环境

默认情况下,anaconda正在使用我的root环境。但是,我始终使用另一个称为py34手动激活的环境。是否可以将默认环境从更改root为另一个环境?

编辑:我忘了提到我在Windows上工作。在Unix系统上,添加一行.bashrc当然是一种解决方案。

python windows environments anaconda

5
推荐指数
1
解决办法
3771
查看次数

Matlab:按行排序

为什么这样呢

t = magic(4);
k = 1:4;
tt(k,:) = sort(t(k,:)) % 
Run Code Online (Sandbox Code Playgroud)

在每列内部排序值(交换行和列不执行任何操作),但这样做

t = magic(4);
for k = 1:4
  tt(k,:) = sort(t(k,:))
end
Run Code Online (Sandbox Code Playgroud)

按预期排序行内的值?

sorting matlab

4
推荐指数
2
解决办法
88
查看次数