小编sal*_*adi的帖子

无法启动rstudio in centos得到错误"无法连接到服务"

我在CentOS 6上安装了Rstudio服务器,但我无法从浏览器中的http:// localhost:8787登录到Rstudio .将出现一个标题为"RStudio Initialization Error"的弹出窗口,其中显示消息"无法连接到服务".

我尝试了以下方法来解决错误,但我一直没有成功:

$ sudo rstudio-server verify-installation
rstudio-server stop/waiting
rserver[19273]: ERROR system error 13 (Permission denied) [username=rstudio-server]; OCCURRED AT: core::Error server::launchSession(const std::string&, const core::system::Options&, PidType*) /root/rstudio/src/cpp/server/ServerSessionManager.cpp:223; LOGGED FROM: int main(int, char* const*) /root/rstudio/src/cpp/server/ServerMain.cpp:428
rstudio-server start/running, process 19287

$ id -u supstat1
502 (user name is more than 500)

$ sudo usermod -g rstudio_users supstat1

$ sudo vi /etc/sysconfig/iptables as root
and added the following line(s)
Add -A INPUT -m state --state NEW -m tcp …
Run Code Online (Sandbox Code Playgroud)

linux r centos rstudio rstudio-server

7
推荐指数
1
解决办法
1万
查看次数

如何在 R 中将二维数据框“展平”或“折叠”为一维数据框?

我在 R 中的 data.frame 中有一个带有距离的二维表(从 csv 导入):

           CP000036   CP001063      CP001368
CP000036      0           a            b
CP001063      a           0            c
CP001368      b           c            0
Run Code Online (Sandbox Code Playgroud)

我想“压平”它。我在第一个列中有一个轴的值​​,在第二个列中有其他轴的值,然后是第三列中的距离:

Genome1      Genome2       Dist
CP000036     CP001063       a
CP000036     CP001368       b
CP001063     CP001368       c
Run Code Online (Sandbox Code Playgroud)

上面是理想的,但如果有重复,输入矩阵中的每个单元格都有自己的行,那就完全没问题了:

Genome1      Genome2       Dist
CP000036     CP000036       0
CP000036     CP001063       a
CP000036     CP001368       b
CP001063     CP000036       a
CP001063     CP001063       0
CP001063     CP001368       c
CP001368     CP000036       b
CP001368     CP001063       c
CP001368     CP001368       0
Run Code Online (Sandbox Code Playgroud)

这是一个示例 3x3 矩阵,但我的数据集 I 更大(大约 2000x2000)。我会在 Excel 中执行此操作,但输出需要约 300 万行,而 Excel 的最大值为约 100 万行。 …

2d r dataframe data.table

6
推荐指数
1
解决办法
4251
查看次数

使用BigQuery加入更新

是否可以在BigQuery中基于现有表的JOIN表上执行UPDATE?

当我在以下数据库(https://bigquery.cloud.google.com/dataset/pfamdb:pfam31)上尝试此语句时,

  UPDATE pfam31.uniprot
  SET uniprot.auto_architecture = uniprot_architecture.auto_architecture
  INNER JOIN
      pfam31.uniprot_architecture using(uniprot_acc)
Run Code Online (Sandbox Code Playgroud)

我收到与有关的错误INNER JOIN,而WHERE不是预期的错误。我应该怎么做(如果可能的话)?

join sql-update google-bigquery bigquery-standard-sql

6
推荐指数
2
解决办法
4247
查看次数

连续一些位置的总和 - R.

考虑通用矩阵nxn - 例如:

A <- matrix(1:16, nrow = 4, ncol = 4)
Run Code Online (Sandbox Code Playgroud)

如何计算"右下"三角形中的行总和并在向量中显示信息?

例

r sum matrix

6
推荐指数
2
解决办法
185
查看次数

奇点提取、编辑和重建图像

我有一个为我制作的奇点容器(用于在 Comet GPU 节点上运行张量流),但我需要根据我的目的修改 keras 安装。

我知道.simg文件不可编辑(并且不推荐使用可写格式),因此不鼓励转换为文件、编辑然后转换回的.img过程:.img.simg

sudo singularity build --writable development.img production.simg
## make changes
sudo singularity build production2.img development.simg
Run Code Online (Sandbox Code Playgroud)

在我看来,最好的方法可能是提取内容(比如放入沙箱中),编辑它们,然后将沙箱重建为.simg图像。

我知道如何进行第二次转换(singularity build new-sif sandbox),但我该如何进行第一次转换?

我已尝试以下操作,但该命令从未完成:

sudo singularity build tf_gpu tensorflow-gpu.simg
WARNING: Authentication token file not found : Only pulls of public images will succeed
Build target already exists. Do you want to overwrite? [N/y] y
2018/10/12 08:39:54 bufio.Scanner: token too long
INFO:    Starting build...
Run Code Online (Sandbox Code Playgroud)

squashfs singularity-container

6
推荐指数
1
解决办法
5189
查看次数

为 matplotlib 绘图后端设置随机种子

我正在使用生成和保存 SVG 图像,matplotlib并希望使它们尽可能可重现。然而,即使在设置np.random.seedand 之后random.seed,SVG 图像中的各种idandxlink:href值在我的代码运行之间仍然会发生变化。

我认为这些差异是由于matplotlib用于渲染 SVG 图像的后端造成的。有没有办法为此后端设置种子,以便相同的图在两次不同的代码运行之间产生相同的输出?

示例代码(运行两次,plt.savefig在第二次运行时更改名称):

import random
import numpy as np
import matplotlib.pyplot as plt

random.seed(42)
np.random.seed(42)

x, y = np.random.randn(4096), np.random.randn(4096)
heatmap, xedges, yedges = np.histogram2d(x, y, bins=(64,64))

fig, axis = plt.subplots()
plt.savefig("random_1.svg")
Run Code Online (Sandbox Code Playgroud)

比较文件:

diff random_1.svg random_2.svg | head
35c35
< " id="md3b71b67b7" style="stroke:#000000;stroke-width:0.8;"/>
---
> " id="m7ee1b067d8" style="stroke:#000000;stroke-width:0.8;"/>
38c38
<        <use style="stroke:#000000;stroke-width:0.8;" x="57.6" xlink:href="#md3b71b67b7" y="307.584"/>
---
>        <use style="stroke:#000000;stroke-width:0.8;" x="57.6" …
Run Code Online (Sandbox Code Playgroud)

python random svg matplotlib reproducible-research

5
推荐指数
1
解决办法
714
查看次数

xgb.DMatrix 错误:标签的长度必须等于输入数据中的行数

我在 R 中使用 xgboost。

我使用矩阵作为输入很好地创建了 xgb 矩阵,但是当我减少矩阵数据中的列数时,我收到错误。

这有效:

> dim(ctt1)

[1] 6401 5901

> xgbmat1 <- xgb.DMatrix(
     Matrix(data.matrix(ctt1)),
     label = as.matrix(as.numeric(data$V2)) - 1
  )
Run Code Online (Sandbox Code Playgroud)

这不会:

> dim(ctt1[,nr])

[1] 6401 1048

xgbmat1 <- xgb.DMatrix(
    Matrix(data.matrix(ctt1[,nr])),
    label = as.matrix(as.numeric(data$V2)) - 1)
Run Code Online (Sandbox Code Playgroud)

xgb.setinfo(dmat,names(p),p[[1]])中的错误:标签的长度必须等于输入数据中的行数

r matrix xgboost

4
推荐指数
1
解决办法
1万
查看次数

argparse:ArgumentDefaultsHelpFormatter 和 MetavarTypeHelpFormatter

argparse.ArgumentDefaultsHelpFormatter是否可以将with的功能结合起来argparse.MetavarTypeHelpFormatter

文档中有有关如何使用其中任何一种的示例,但尚不清楚如何创建结合两者优点的帮助文本?

例如,我想要类似以下的内容:

parser = argparse.ArgumentParser(prog='PROG')
parser.add_argument('--foo', type=int, default=42, help='FOO!')
parser.add_argument('bar', nargs='*', default=[1, 2, 3], help='BAR!')
Run Code Online (Sandbox Code Playgroud)

产生如下内容:

usage: PROG [-h] [--foo int] [float [float ...]]

positional arguments:
 float         BAR! (default: [1, 2, 3])

optional arguments:
 -h, --help  show this help message and exit
 --foo int   FOO! (default: 42)
Run Code Online (Sandbox Code Playgroud)

python argparse

4
推荐指数
1
解决办法
1272
查看次数

将压缩的 csv 拆分为块的最有效方法

我有一些非常大的 gzip 压缩 csv 文件( 的压缩输出mysqldump)——每个大约 65 GB。

我需要将它们分成每个小于 4 GB(压缩后)的压缩块,记住每个 csv 文件中都存在引用的换行符。

在'nix 命令行(例如在Debian)上执行此操作的最有效方法是什么?

与此SO类似,尽管响应没有正确考虑引用的换行符。

csv shell command-line

4
推荐指数
1
解决办法
2722
查看次数

为什么 bzip2 的最大块大小是 900k?

bzip2(即Julian Seward 的这个程序)列出了 100k 到 900k 之间的可用块大小:

 $ bzip2 --help
 bzip2, a block-sorting file compressor.  Version 1.0.6, 6-Sept-2010.

 usage: bzip2 [flags and input files in any order]

   -1 .. -9            set block size to 100k .. 900k
Run Code Online (Sandbox Code Playgroud)

该数字对应于hundred_k_blocksize写入压缩文件的值。

文档来看,内存要求如下:

Compression:   400k + ( 8 x block size )

Decompression: 100k + ( 4 x block size ), or
               100k + ( 2.5 x block size )
Run Code Online (Sandbox Code Playgroud)

在编写原始程序时(1996 年),我想 7.6M(400k + 8 …

compression bzip2 burrows-wheeler-transform

4
推荐指数
1
解决办法
858
查看次数