小编duc*_*ayr的帖子

如何更改R包的默认库路径

我试图在我的工作计算机上的本地驱动器上安装R和R studio,而不是组织网络文件夹,因为任何通过网络运行的都非常慢.安装时,目标路径显示它是我的本地C:驱动器.但是,当我安装新软件包时,显示的默认路径是我的网络驱动器,没有更改选项:

.libPaths()
[1] "\\\\The library/path/I/don't/want"
[2] "C:/Program Files/R/R-3.2.1/library" 
Run Code Online (Sandbox Code Playgroud)

我正在运行Windows 7专业版.如何删除库路径[1]并使路径[2]成为我安装的所有基础包和所有新包的主要路径?

r

34
推荐指数
5
解决办法
9万
查看次数

根据方面的存在有条件地修改ggplot主题?

我正在研究自定义 ggplot2 主题,并认为根据绘图对象的某些特征自动修改主题元素可能很不错。例如,有没有办法指定如果绘图包含面,则为每个面板添加边框?

我想问题是真的,我可以从自定义 theme() 调用中访问当前的 gg 对象,然后有条件地应用某些主题元素吗?在我的脑海中,我会将我的主题功能定义为这样的:

theme_custom <- function() {
  if (plot$facet$params > 0) {
  theme_minimal() +
    theme(panel.border = element_rect(color = "gray 50", fill = NA))
  }
  else {
    theme_minimal()
    }
}
Run Code Online (Sandbox Code Playgroud)

如果这是可能的,它在使用中看起来像这样:

library(ggplot2)

# plot with facets automatically adds panel borders
ggplot(mtcars, aes(mpg, wt)) +
  geom_point() +
  facet_wrap(vars(cyl)) +
  theme_custom()
Run Code Online (Sandbox Code Playgroud)

# plot without facets no panel border
ggplot(mtcars, aes(mpg, wt)) +
  geom_point() +
  theme_custom() 
Run Code Online (Sandbox Code Playgroud)

注意:这最初发布在RStudio 社区上,但没有收到答复。

r ggplot2

8
推荐指数
1
解决办法
370
查看次数

如何删除 Python 中的重复短语?

假设我有一个字符串,例如

'I hate *some* kinds of duplicate. This string has a duplicate phrase, duplicate phrase.'
Run Code Online (Sandbox Code Playgroud)

我想删除第二次出现的 ,duplicate phrase而不删除其组成部分的其他出现,例如duplicate.

此外,我需要删除所有 潜在的重复短语,而不仅仅是我事先知道的某些特定短语的重复项。

我发现了几篇关于类似问题的帖子,但没有一个能帮助我解决我的特定问题:

我曾希望根据re.sub(r'\b(.+)(\s+\1\b)+', r'\1', s)我的目的调整最后一个链接 ( ) 中的方法,但无法弄清楚如何做到这一点。

如何从 Python 中的字符串中删除两个或多个单词的所有任意重复短语?

python regex replace python-2.7

7
推荐指数
1
解决办法
1853
查看次数

我正在尝试使用 Ubuntu 18.04 在 R 中安装 openssl 包但没有成功

我尝试在 R 中安装 Openssl 包(在 Ubuntu 18.04 中使用 RStudio),但出现错误“未定义符号:RSA_pkey_ctx_ctrl”:

Error: package or namespace load failed for ‘openssl’ in dyn.load(file, DLLpath = DLLpath, ...):
 unable to load shared object '/home/danilo/R/x86_64-pc-linux-gnu-library/3.4/openssl/libs/openssl.so':
  /home/danilo/R/x86_64-pc-linux-gnu-library/3.4/openssl/libs/openssl.so: undefined symbol: RSA_pkey_ctx_ctrl
Error: loading failed
Execution halted
ERROR: loading failed
* removing ‘/home/danilo/R/x86_64-pc-linux-gnu-library/3.4/openssl’
Warning in install.packages :
  installation of package ‘openssl’ had non-zero exit status.
Run Code Online (Sandbox Code Playgroud)

我已经尝试通过 RStudio 和终端进行安装,但由于我对 Ubuntu 比较陌生,所以我没有任何成功。我下载了 tar.gz 文件,但我不知道该怎么处理它。

我实际上想使用包httrggmap,但它们都需要openssl.

openssl r

7
推荐指数
1
解决办法
5734
查看次数

Create_Matrix'RTextTools'包的并行计算

我正在创建一个DocumentTermMatrix使用create_matrix()RTextTools创建containermodel基于它.它适用于极大的数据集.

我为每个类别(因子级别)执行此操作.因此,对于每个类别,它必须运行矩阵,容器和模型.当我运行下面的代码(例如16核/ 64 GB)时 - 它只在一个核心中运行,并且使用的内存小于10%.

有没有办法加快这个过程?也许用doparallel&foreach?任何信息肯定会有所帮助.

#import the required libraries
library("RTextTools")
library("hash")
library(tm)

for ( n in 1:length(folderaddress)){
    #Initialize the variables
    traindata = list()
    matrix = list()
    container = list()
    models = list()
    trainingdata = list()
    results = list()
    classifiermodeldiv = 0.80`

    #Create the directory to place the models and the output files
    pradd = paste(combinedmodelsaveaddress[n],"SelftestClassifierModels",sep="")
    if (!file.exists(pradd)){
        dir.create(file.path(pradd))
    }  
    Data$CATEGORY <- as.factor(Data$CATEGORY)

    #Read the …
Run Code Online (Sandbox Code Playgroud)

parallel-processing foreach text-processing r doparallel

6
推荐指数
1
解决办法
208
查看次数

如何控制使用 roxygen2 记录的 R 包中的导入顺序?

roxygen2NAMESPACE将根据我的包文档中的指令自动构建一个文件@import。但显然,我如何排序指令并不重要@import,它总是按字母顺序添加导入。

这给我带来了问题:我正在开发一个需要同时导入IRanges和 的包data.table。这两个包都定义了一个名为 的函数shift,因此导入顺序很重要(shift环境中的函数将来自最后加载的包)。

在我的 roxygen2 代码中,我说:

@import data.table
@import IRanges
Run Code Online (Sandbox Code Playgroud)

我把它放在第一位data.table是因为我希望shift函数 fromIRanges覆盖函数 fromdata.table但行的顺序@import似乎并不重要,因为总是将导入行放入文件roxygen2中。然后我收到这条消息:NAMESPACEIRanges

2:加载时用“data.table::shift”替换先前导入的“IRanges::shift”...

我希望情况正好相反;但实际上,即使我碰巧在这里很幸运,我也不想依赖字母顺序来工作。有什么办法可以控制这个吗?

编辑:我相信data.table是在后面,IRanges因为 theI是大写的。

import r roxygen2

5
推荐指数
0
解决办法
349
查看次数

为什么 C++ 不推荐使用的警告会打印两次?

如果我有

namespace foo {
    inline int bar() {
        return 1119;
    }
}

__attribute__((deprecated)) inline int bar() {
    return 138;
}
Run Code Online (Sandbox Code Playgroud)

header.h

#include "header.h"
#include <iostream>

int main() {
    int x = bar();
    int y = foo::bar();
    std::cout << x << std::endl;
    std::cout << y << std::endl;
}
Run Code Online (Sandbox Code Playgroud)

source.cpp,那么

g++ source.cpp -o deprecated-test
Run Code Online (Sandbox Code Playgroud)

结果是

source.cpp: In function ‘int main()’:
source.cpp:5:17: warning: ‘int bar()’ is deprecated [-Wdeprecated-declarations]
     int x = bar();
                 ^
In file included from source.cpp:1:
header.h:7:40: …
Run Code Online (Sandbox Code Playgroud)

c++ gcc g++

5
推荐指数
1
解决办法
177
查看次数

如何在 R Markdown 中自动化文本和代码块之间的不同间距?

考虑以下 R Markdown 文档:

---
title: "Stack Overflow Question"
author: "duckmayr"
date: "6/21/2019"
output: pdf_document
header-includes:
    - \usepackage{setspace}
    - \doublespacing
---

```{r setup, include=FALSE}
knitr::opts_chunk$set(echo = TRUE)
```

Here is some example text.
I want all the body text to be double-spaced,
but I want all echoed code from code chunks to be single spaced.
In other words, not this:

```{r}
## This code is double-spaced.
## I want it to be single spaced.
## How can I do that? …
Run Code Online (Sandbox Code Playgroud)

r r-markdown

5
推荐指数
1
解决办法
965
查看次数

R调用包本身中的数据集

我创建了一个包含名为的数据集的包mydata

我想在函数中使用数据集,但我不知道如何调用它。当我data("mydata")用来调用数据集并避免出现警告消息时,在构建过程中我还有另一条消息

请参见“数据”中的“良好做法”部分。

@imporFrom mypackage mydata也不起作用。在包本身中调用数据集的最佳方法是什么?

packaging r dataset package

5
推荐指数
1
解决办法
44
查看次数

R install.packages polyclip:config.log 在哪里?在之前的帖子中没有答案

尝试安装 R 包时ggforce遇到以下错误安装依赖 polyclip 将我提到 config.log。但是,在 ~/、/tmp 或 /var/log 下找不到 config.log我通过

find . | grep config[.]log 
Run Code Online (Sandbox Code Playgroud)

install.packages("ggforce",keep_outputs = TRUE)未提供任何附加信息的尝试;

 install.packages("ggforce",keep_outputs = TRUE,verbose = TRUE)
Run Code Online (Sandbox Code Playgroud)

“配置:错误:在`/tmp/RtmpAkq4Vm/R.INSTALL6c31457f19ba/polyclip'”

但是/tmp/RtmpAkq4Vm安装后不存在。

有人能告诉我它在哪里吗?

错误详情:

 install.packages("ggforce")
Installing package into ‘/home/dutky/R/x86_64-pc-linux-gnu-library/3.6’
(as ‘lib’ is unspecified)
also installing the dependency ‘polyclip’

trying URL 'https://cloud.r-project.org/src/contrib/polyclip_1.10-0.tar.gz'
Content type 'application/x-gzip' length 79619 bytes (77 KB)
==================================================
downloaded 77 KB

trying URL 'https://cloud.r-project.org/src/contrib/ggforce_0.3.1.tar.gz'
Content type 'application/x-gzip' length 857814 bytes (837 KB)
==================================================
downloaded 837 KB

[1] …
Run Code Online (Sandbox Code Playgroud)

r g++ install.packages ggforce

3
推荐指数
1
解决办法
593
查看次数