小编sal*_*adi的帖子

无法启动rstudio in centos得到错误"无法连接到服务"

我在CentOS 6上安装了Rstudio服务器,但我无法从浏览器中的http:// localhost:8787登录到Rstudio .将出现一个标题为"RStudio Initialization Error"的弹出窗口,其中显示消息"无法连接到服务".

我尝试了以下方法来解决错误,但我一直没有成功:

$ sudo rstudio-server verify-installation
rstudio-server stop/waiting
rserver[19273]: ERROR system error 13 (Permission denied) [username=rstudio-server]; OCCURRED AT: core::Error server::launchSession(const std::string&, const core::system::Options&, PidType*) /root/rstudio/src/cpp/server/ServerSessionManager.cpp:223; LOGGED FROM: int main(int, char* const*) /root/rstudio/src/cpp/server/ServerMain.cpp:428
rstudio-server start/running, process 19287

$ id -u supstat1
502 (user name is more than 500)

$ sudo usermod -g rstudio_users supstat1

$ sudo vi /etc/sysconfig/iptables as root
and added the following line(s)
Add -A INPUT -m state --state NEW -m tcp …

Run Code Online (Sandbox Code Playgroud)

linux r centos rstudio rstudio-server

har*_*rry

2016 01-11

7
推荐指数

1
解决办法

1万
查看次数

如何在 R 中将二维数据框“展平”或“折叠”为一维数据框？

我在 R 中的 data.frame 中有一个带有距离的二维表（从 csv 导入）：

           CP000036   CP001063      CP001368
CP000036      0           a            b
CP001063      a           0            c
CP001368      b           c            0

Run Code Online (Sandbox Code Playgroud)

我想“压平”它。我在第一个列中有一个轴的值，在第二个列中有其他轴的值，然后是第三列中的距离：

Genome1      Genome2       Dist
CP000036     CP001063       a
CP000036     CP001368       b
CP001063     CP001368       c

Run Code Online (Sandbox Code Playgroud)

上面是理想的，但如果有重复，输入矩阵中的每个单元格都有自己的行，那就完全没问题了：

Genome1      Genome2       Dist
CP000036     CP000036       0
CP000036     CP001063       a
CP000036     CP001368       b
CP001063     CP000036       a
CP001063     CP001063       0
CP001063     CP001368       c
CP001368     CP000036       b
CP001368     CP001063       c
CP001368     CP001368       0

Run Code Online (Sandbox Code Playgroud)

这是一个示例 3x3 矩阵，但我的数据集 I 更大（大约 2000x2000）。我会在 Excel 中执行此操作，但输出需要约 300 万行，而 Excel 的最大值为约 100 万行。 …

2d r dataframe data.table

sal*_*adi

2017 05-23

6
推荐指数

1
解决办法

4251
查看次数

使用BigQuery加入更新

是否可以在BigQuery中基于现有表的JOIN表上执行UPDATE？

当我在以下数据库（https://bigquery.cloud.google.com/dataset/pfamdb:pfam31）上尝试此语句时，

  UPDATE pfam31.uniprot
  SET uniprot.auto_architecture = uniprot_architecture.auto_architecture
  INNER JOIN
      pfam31.uniprot_architecture using(uniprot_acc)

Run Code Online (Sandbox Code Playgroud)

我收到与有关的错误INNER JOIN，而WHERE不是预期的错误。我应该怎么做（如果可能的话）？

join sql-update google-bigquery bigquery-standard-sql

sal*_*adi

lucky-day

6
推荐指数

2
解决办法

4247
查看次数

连续一些位置的总和 - R.

考虑通用矩阵nxn - 例如:

A <- matrix(1:16, nrow = 4, ncol = 4)

Run Code Online (Sandbox Code Playgroud)

如何计算"右下"三角形中的行总和并在向量中显示信息？

r sum matrix

Ant*_*ruz

2017 12-10

6
推荐指数

2
解决办法

185
查看次数

奇点提取、编辑和重建图像

我有一个为我制作的奇点容器（用于在 Comet GPU 节点上运行张量流），但我需要根据我的目的修改 keras 安装。

我知道.simg文件不可编辑（并且不推荐使用可写格式），因此不鼓励转换为文件、编辑然后转换回的.img过程：.img.simg

sudo singularity build --writable development.img production.simg
## make changes
sudo singularity build production2.img development.simg

Run Code Online (Sandbox Code Playgroud)

在我看来，最好的方法可能是提取内容（比如放入沙箱中），编辑它们，然后将沙箱重建为.simg图像。

我知道如何进行第二次转换（singularity build new-sif sandbox），但我该如何进行第一次转换？

我已尝试以下操作，但该命令从未完成：

sudo singularity build tf_gpu tensorflow-gpu.simg
WARNING: Authentication token file not found : Only pulls of public images will succeed
Build target already exists. Do you want to overwrite? [N/y] y
2018/10/12 08:39:54 bufio.Scanner: token too long
INFO:    Starting build...

Run Code Online (Sandbox Code Playgroud)

squashfs singularity-container

sal*_*adi

2018 10-13

6
推荐指数

1
解决办法

5189
查看次数

为 matplotlib 绘图后端设置随机种子

我正在使用生成和保存 SVG 图像，matplotlib并希望使它们尽可能可重现。然而，即使在设置np.random.seedand 之后random.seed，SVG 图像中的各种idandxlink:href值在我的代码运行之间仍然会发生变化。

我认为这些差异是由于matplotlib用于渲染 SVG 图像的后端造成的。有没有办法为此后端设置种子，以便相同的图在两次不同的代码运行之间产生相同的输出？

示例代码（运行两次，plt.savefig在第二次运行时更改名称）：

import random
import numpy as np
import matplotlib.pyplot as plt

random.seed(42)
np.random.seed(42)

x, y = np.random.randn(4096), np.random.randn(4096)
heatmap, xedges, yedges = np.histogram2d(x, y, bins=(64,64))

fig, axis = plt.subplots()
plt.savefig("random_1.svg")

Run Code Online (Sandbox Code Playgroud)

比较文件：

diff random_1.svg random_2.svg | head
35c35
< " id="md3b71b67b7" style="stroke:#000000;stroke-width:0.8;"/>
---
> " id="m7ee1b067d8" style="stroke:#000000;stroke-width:0.8;"/>
38c38
<        <use style="stroke:#000000;stroke-width:0.8;" x="57.6" xlink:href="#md3b71b67b7" y="307.584"/>
---
>        <use style="stroke:#000000;stroke-width:0.8;" x="57.6" …

Run Code Online (Sandbox Code Playgroud)

python random svg matplotlib reproducible-research

sal*_*adi

2018 01-05

5
推荐指数

1
解决办法

714
查看次数

xgb.DMatrix 错误：标签的长度必须等于输入数据中的行数

我在 R 中使用 xgboost。

我使用矩阵作为输入很好地创建了 xgb 矩阵，但是当我减少矩阵数据中的列数时，我收到错误。

这有效：

> dim(ctt1)

[1] 6401 5901

> xgbmat1 <- xgb.DMatrix(
     Matrix(data.matrix(ctt1)),
     label = as.matrix(as.numeric(data$V2)) - 1
  )

Run Code Online (Sandbox Code Playgroud)

这不会：

> dim(ctt1[,nr])

[1] 6401 1048

xgbmat1 <- xgb.DMatrix(
    Matrix(data.matrix(ctt1[,nr])),
    label = as.matrix(as.numeric(data$V2)) - 1)

Run Code Online (Sandbox Code Playgroud)

xgb.setinfo（dmat，names（p），p[[1]]）中的错误：标签的长度必须等于输入数据中的行数

r matrix xgboost

Ell*_* Xu

2020 03-03

4
推荐指数

1
解决办法

1万
查看次数

argparse：ArgumentDefaultsHelpFormatter 和 MetavarTypeHelpFormatter

argparse.ArgumentDefaultsHelpFormatter是否可以将with的功能结合起来argparse.MetavarTypeHelpFormatter？

文档中有有关如何使用其中任何一种的示例，但尚不清楚如何创建结合两者优点的帮助文本？

例如，我想要类似以下的内容：

parser = argparse.ArgumentParser(prog='PROG')
parser.add_argument('--foo', type=int, default=42, help='FOO!')
parser.add_argument('bar', nargs='*', default=[1, 2, 3], help='BAR!')

Run Code Online (Sandbox Code Playgroud)

产生如下内容：

usage: PROG [-h] [--foo int] [float [float ...]]

positional arguments:
 float         BAR! (default: [1, 2, 3])

optional arguments:
 -h, --help  show this help message and exit
 --foo int   FOO! (default: 42)

Run Code Online (Sandbox Code Playgroud)

python argparse

sal*_*adi

lucky-day

4
推荐指数

1
解决办法

1272
查看次数

将压缩的 csv 拆分为块的最有效方法

我有一些非常大的 gzip 压缩 csv 文件（的压缩输出mysqldump）——每个大约 65 GB。

我需要将它们分成每个小于 4 GB（压缩后）的压缩块，记住每个 csv 文件中都存在引用的换行符。

在'nix 命令行（例如在Debian）上执行此操作的最有效方法是什么？

与此SO类似，尽管响应没有正确考虑引用的换行符。

csv shell command-line

sal*_*adi

lucky-day

4
推荐指数

1
解决办法

2722
查看次数

为什么 bzip2 的最大块大小是 900k？

bzip2（即Julian Seward 的这个程序）列出了 100k 到 900k 之间的可用块大小：

 $ bzip2 --help
 bzip2, a block-sorting file compressor.  Version 1.0.6, 6-Sept-2010.

 usage: bzip2 [flags and input files in any order]

   -1 .. -9            set block size to 100k .. 900k

Run Code Online (Sandbox Code Playgroud)

该数字对应于hundred_k_blocksize写入压缩文件头的值。

从文档来看，内存要求如下：

Compression:   400k + ( 8 x block size )

Decompression: 100k + ( 4 x block size ), or
               100k + ( 2.5 x block size )

Run Code Online (Sandbox Code Playgroud)

在编写原始程序时（1996 年），我想 7.6M（400k + 8 …

compression bzip2 burrows-wheeler-transform

sal*_*adi

lucky-day

4
推荐指数

1
解决办法

858
查看次数

标签统计

r ×4

matrix ×2

python ×2

2d ×1

argparse ×1

bigquery-standard-sql ×1

burrows-wheeler-transform ×1

bzip2 ×1

centos ×1

command-line ×1

compression ×1

csv ×1

data.table ×1

dataframe ×1

google-bigquery ×1

join ×1

linux ×1

matplotlib ×1

random ×1

reproducible-research ×1

rstudio ×1

rstudio-server ×1

shell ×1

singularity-container ×1

sql-update ×1

squashfs ×1

sum ×1

svg ×1

xgboost ×1

标签 统计

小编sal_adi的帖子

标签统计