小编use*_*584的帖子

R ggplot透明度 - 以其他变量为条件的alpha值

我有以下数据:[来自R图形食谱的例子]

Cultivar Date Weight sd          n  se          big
c39     d16   3.18  0.9566144   10  0.30250803  TRUE
c39     d20   2.8   0.2788867   10  0.08819171  TRUE
c39     d21   2.74  0.9834181   10  0.3109841   TRUE
c52     d16   2.26  0.4452215   10  0.14079141  FALSE
c52     d20   3.11  0.7908505   10  0.25008887  TRUE
c52     d21   1.47  0.2110819   10  0.06674995  FALSE
Run Code Online (Sandbox Code Playgroud)

我想要一个条形图,其中条形透明度取决于big变量.

我尝试了以下内容,我尝试alpha根据不同的big值设置值:

ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar)) +
  geom_bar(position="dodge", stat="identity")
ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar)) +
  geom_bar(position="dodge", stat="identity", alpha=cabbage_exp$big=c("TRUE"= 0.9, "FALSE" = 0.35)) 
ggplot(cabbage_exp, aes(x=Date, y=Weight, …
Run Code Online (Sandbox Code Playgroud)

plot r colors ggplot2

14
推荐指数
2
解决办法
1万
查看次数

R通过将字符串匹配到字符串列表来重新排序矩阵列

对不起,如果这是非常基本的.我有一个名称列表和一个矩阵,这些名称作为列名.但是,组合名称的顺序不同.

例如.名单:colname4 colname3 colname2 colname5 colname1 Matrix Colnames:colname1 colname2 colname3 colname4 colname5

我试图按照名称顺序列表的顺序排列矩阵列.

我试过test <- match(colnames(matrix1), colnames(matrix2))但它没有用.你知道其他选择吗?

string r matrix

8
推荐指数
1
解决办法
9847
查看次数

R无法处理繁重的任务数小时

我有一个压缩文件列表[~90个文件].我已经编写了一个循环来解压缩它们(每个文件大约1Gb),做一些计算,保存每个文件的输出并删除解压缩的文件.此过程的一次迭代需要每个文件30-60分钟[并非所有文件的大小完全相同].

我不太担心时间,因为我可以让它在周末工作.然而,R并没有设法完全通过.我在星期五晚上离开了它,它只运行了12个小时,所以它只处理了90个文件中的30个.

我不经常处理这种类型的重型过程,但过去在类似过程中也是如此.我需要在循环中插入任何命令以避免计算机因此密集过程而冻结吗?我gc()在循环结束时尝试无济于事.

是否有针对此类程序的"良好做法"建议清单?

memory loops r freeze

8
推荐指数
1
解决办法
85
查看次数

如何对列表中存储的data.frame进行子集化?

我创建了一个列表,并在每个组件中存储了一个数据帧.现在我想过滤那些数据帧,只保留特定列中具有NA的行.我希望此操作的结果是包含数据帧的另一个列表,其中只有那些在该列中具有NA的行.

这是一些代码,以澄清我在说什么.假设d1并且d2是我的数据框架

set.seed(1)

d1<-data.frame(a=rnorm(5), b=c(rep(2006, times=4),NA))
d2<-data.frame(a=1:5, b=c(2007, 2007, NA, NA, 2007))  

print(d1)
 a    b
 1.3011543 2006
 0.3780023 2006
-0.3101449 2006
-1.3927445 2006
-1.0726218   NA

print(d2)
a    b
1 2007
2 2007
3   NA
4   NA
5 2007
Run Code Online (Sandbox Code Playgroud)

我把它放在一个带有for循环的列表中

ls<-list()

for (i in 1:2){ 

  str<-paste("d", i, sep="")
  dat<-get(str)
  ls[[str]]<-dat

}
Run Code Online (Sandbox Code Playgroud)

现在我想过滤每个列表组件,以便只留下包含NA的列b行.为此,我尝试使用以下命令,从一开始就知道它会失败.我的问题是我不知道是否subset()使用正确的函数,如果是,我不知道如何限定每个数据框(即子集函数的第一个元素)

lsNA<-lapply(ls, subset(ls, is.na(b)))
Run Code Online (Sandbox Code Playgroud)

能帮我解决一下我的严重局限吗?

r list subset lapply dataframe

6
推荐指数
2
解决办法
1万
查看次数

MySQL错误"作为!字符的参数给出的空字符串"

我有一个非常简单的查询

select * 
from tablename 
where keyvar is not null 
order by keyvar
Run Code Online (Sandbox Code Playgroud)

该查询之前有效但由于某种原因现在我收到错误:

错误:格式化SQL查询时出错:作为参数给出的空字符串!字符

任何人都知道我为什么会收到此错误?任何帮助非常感谢

PS:如果我从头开始再次运行整个代码(创建数据库,加载csv文件等),查询工作正常.

mysql sql

5
推荐指数
1
解决办法
4601
查看次数

R-ggmap中的非方形(矩形)贴图

我需要在非方形地图中绘制空间数据.

我一直在使用ggmap,据说你可以得到非方形地图,给出低西角和右上角坐标.然而,实际上它似乎不起作用(在这里这里报道).

任何人都知道如何在R/ggmap中获得矩形地图?

google-maps r ggmap

5
推荐指数
1
解决办法
2214
查看次数

在 R 中计算内部、之间或整体 R 平方

我正在从 Stata 迁移到 R ( plm package) 以进行面板模型计量经济学。在 Stata 中,随机效应等面板模型通常报告内部、之间和整体 R 平方。

我发现plm随机效应模型中报告的 R 平方对应于内部 R 平方。那么,有没有办法使用plm packagein R获得整体和 R 平方之间的关系?

请参阅 R 和 Stata 的相同示例:

library(plm)
library(foreign) # read Stata files
download.file('http://fmwww.bc.edu/ec-p/data/wooldridge/wagepan.dta','wagepan.dta',mode="wb")
wagepan <- read.dta('wagepan.dta')

# Random effects
plm.re <- plm(lwage ~ educ + black + hisp + exper + expersq + married + union + d81 + d82 + d83 + d84 + d85 + d86 + d87,
              data=wagepan,
              model='random',
              index=c('nr','year'))
summary(plm.re)
Run Code Online (Sandbox Code Playgroud)

在斯塔塔: …

r stata panel-data plm

5
推荐指数
1
解决办法
3392
查看次数

连接字符串和变量值

我想在 Python 3 中连接字符串和变量值。例如,R我可以执行以下操作:

today <- as.character(Sys.Date())
paste0("In ", substr(today,1,4), " this can be an R way") 
Run Code Online (Sandbox Code Playgroud)

Ryield 中执行此代码[1] "In the year 2018 R is so straightforward"

Python 3.6尝试过类似的事情:

today = datetime.datetime.now()
"In year " + today.year + " I should learn more Python"
Run Code Online (Sandbox Code Playgroud)

today.year对它自己的 yields 2018,但整个串联产生错误:'int' object is not callable

在 Python3 中连接字符串和变量值的最佳方法是什么?

python r concatenation string-concatenation

5
推荐指数
1
解决办法
1万
查看次数

如何运行 .sql 文件作为 MySQL Workbench 6.2 查询的一部分?

我正在使用 MySQL Workbench 6.2 [Windows7],我想用我的所有步骤创建一个脚本。在这些步骤中,我在计算机上存储了一系列用于创建和填充表的 .sql 文件。我想从查询选项卡运行这些文件,但每次我使用此命令时:

源 C:/Users/[用户名]/Desktop/sampdb/create_president.sql;

我收到错误 1064,其中显示

“错误代码:1064。您的 SQL 语法有错误;检查与您的 MySQL 服务器版本相对应的手册,了解在 'mysql> 源 C:/Users/[用户名]/Desktop/sampdb/create_president 附近使用的正确语法.sql 第 1 行“

MySQL 嵌套脚本噩梦

谁能告诉我我做错了什么?如何在 MySQL Workbench 脚本中引用 .sql 文件?

我应该在 MySQL Workbench 中使用什么代码来代替source?我已经尝试过LOAD DATA LOCAL INFILE 'C:/Users/[username]/Desktop/sampdb/create_president.sql';,但也没有成功。知道会出什么问题吗?

*仅供参考,create_president.sql 包含以下代码:

DROP TABLE IF EXISTS president;
#@ _CREATE_TABLE_
CREATE TABLE president
(
  last_name  VARCHAR(15) NOT NULL,
  first_name VARCHAR(15) NOT NULL,
  suffix     VARCHAR(5) NULL,
  city       VARCHAR(20) NOT NULL,
  state      VARCHAR(2) NOT NULL,
  birth      DATE NOT NULL,
  death      DATE NULL …
Run Code Online (Sandbox Code Playgroud)

mysql sql mysql-workbench

4
推荐指数
2
解决办法
2万
查看次数

获取 R (plm) 中回归所使用的数据观测值

我正在估计带有包装的面板模型plm。小组中的一些人没有所有解释变量的数据,因此他们被排除在回归之外。我如何才能看到哪些特定观测值已用于估计?

在 Stata 中常用的命令是e(sample). R 中的等价物是什么?

regression r plm

4
推荐指数
1
解决办法
1985
查看次数