我有以下数据:[来自R图形食谱的例子]
Cultivar Date Weight sd n se big
c39 d16 3.18 0.9566144 10 0.30250803 TRUE
c39 d20 2.8 0.2788867 10 0.08819171 TRUE
c39 d21 2.74 0.9834181 10 0.3109841 TRUE
c52 d16 2.26 0.4452215 10 0.14079141 FALSE
c52 d20 3.11 0.7908505 10 0.25008887 TRUE
c52 d21 1.47 0.2110819 10 0.06674995 FALSE
Run Code Online (Sandbox Code Playgroud)
我想要一个条形图,其中条形透明度取决于big变量.
我尝试了以下内容,我尝试alpha根据不同的big值设置值:
ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar)) +
geom_bar(position="dodge", stat="identity")
ggplot(cabbage_exp, aes(x=Date, y=Weight, fill=Cultivar)) +
geom_bar(position="dodge", stat="identity", alpha=cabbage_exp$big=c("TRUE"= 0.9, "FALSE" = 0.35))
ggplot(cabbage_exp, aes(x=Date, y=Weight, …Run Code Online (Sandbox Code Playgroud) 对不起,如果这是非常基本的.我有一个名称列表和一个矩阵,这些名称作为列名.但是,组合名称的顺序不同.
例如.名单:colname4 colname3 colname2 colname5 colname1
Matrix Colnames:colname1 colname2 colname3 colname4 colname5
我试图按照名称顺序列表的顺序排列矩阵列.
我试过test <- match(colnames(matrix1), colnames(matrix2))但它没有用.你知道其他选择吗?
我有一个压缩文件列表[~90个文件].我已经编写了一个循环来解压缩它们(每个文件大约1Gb),做一些计算,保存每个文件的输出并删除解压缩的文件.此过程的一次迭代需要每个文件30-60分钟[并非所有文件的大小完全相同].
我不太担心时间,因为我可以让它在周末工作.然而,R并没有设法完全通过.我在星期五晚上离开了它,它只运行了12个小时,所以它只处理了90个文件中的30个.
我不经常处理这种类型的重型过程,但过去在类似过程中也是如此.我需要在循环中插入任何命令以避免计算机因此密集过程而冻结吗?我gc()在循环结束时尝试无济于事.
是否有针对此类程序的"良好做法"建议清单?
我创建了一个列表,并在每个组件中存储了一个数据帧.现在我想过滤那些数据帧,只保留特定列中具有NA的行.我希望此操作的结果是包含数据帧的另一个列表,其中只有那些在该列中具有NA的行.
这是一些代码,以澄清我在说什么.假设d1并且d2是我的数据框架
set.seed(1)
d1<-data.frame(a=rnorm(5), b=c(rep(2006, times=4),NA))
d2<-data.frame(a=1:5, b=c(2007, 2007, NA, NA, 2007))
print(d1)
a b
1.3011543 2006
0.3780023 2006
-0.3101449 2006
-1.3927445 2006
-1.0726218 NA
print(d2)
a b
1 2007
2 2007
3 NA
4 NA
5 2007
Run Code Online (Sandbox Code Playgroud)
我把它放在一个带有for循环的列表中
ls<-list()
for (i in 1:2){
str<-paste("d", i, sep="")
dat<-get(str)
ls[[str]]<-dat
}
Run Code Online (Sandbox Code Playgroud)
现在我想过滤每个列表组件,以便只留下包含NA的列b行.为此,我尝试使用以下命令,从一开始就知道它会失败.我的问题是我不知道是否subset()使用正确的函数,如果是,我不知道如何限定每个数据框(即子集函数的第一个元素)
lsNA<-lapply(ls, subset(ls, is.na(b)))
Run Code Online (Sandbox Code Playgroud)
能帮我解决一下我的严重局限吗?
我有一个非常简单的查询
select *
from tablename
where keyvar is not null
order by keyvar
Run Code Online (Sandbox Code Playgroud)
该查询之前有效但由于某种原因现在我收到错误:
错误:格式化SQL查询时出错:作为参数给出的空字符串!字符
任何人都知道我为什么会收到此错误?任何帮助非常感谢
PS:如果我从头开始再次运行整个代码(创建数据库,加载csv文件等),查询工作正常.
我正在从 Stata 迁移到 R ( plm package) 以进行面板模型计量经济学。在 Stata 中,随机效应等面板模型通常报告内部、之间和整体 R 平方。
我发现plm随机效应模型中报告的 R 平方对应于内部 R 平方。那么,有没有办法使用plm packagein R获得整体和 R 平方之间的关系?
请参阅 R 和 Stata 的相同示例:
library(plm)
library(foreign) # read Stata files
download.file('http://fmwww.bc.edu/ec-p/data/wooldridge/wagepan.dta','wagepan.dta',mode="wb")
wagepan <- read.dta('wagepan.dta')
# Random effects
plm.re <- plm(lwage ~ educ + black + hisp + exper + expersq + married + union + d81 + d82 + d83 + d84 + d85 + d86 + d87,
data=wagepan,
model='random',
index=c('nr','year'))
summary(plm.re)
Run Code Online (Sandbox Code Playgroud)
在斯塔塔: …
我想在 Python 3 中连接字符串和变量值。例如,R我可以执行以下操作:
today <- as.character(Sys.Date())
paste0("In ", substr(today,1,4), " this can be an R way")
Run Code Online (Sandbox Code Playgroud)
在Ryield 中执行此代码[1] "In the year 2018 R is so straightforward"。
在Python 3.6尝试过类似的事情:
today = datetime.datetime.now()
"In year " + today.year + " I should learn more Python"
Run Code Online (Sandbox Code Playgroud)
today.year对它自己的 yields 2018,但整个串联产生错误:'int' object is not callable
在 Python3 中连接字符串和变量值的最佳方法是什么?
我正在使用 MySQL Workbench 6.2 [Windows7],我想用我的所有步骤创建一个脚本。在这些步骤中,我在计算机上存储了一系列用于创建和填充表的 .sql 文件。我想从查询选项卡运行这些文件,但每次我使用此命令时:
源 C:/Users/[用户名]/Desktop/sampdb/create_president.sql;
我收到错误 1064,其中显示
“错误代码:1064。您的 SQL 语法有错误;检查与您的 MySQL 服务器版本相对应的手册,了解在 'mysql> 源 C:/Users/[用户名]/Desktop/sampdb/create_president 附近使用的正确语法.sql 第 1 行“
谁能告诉我我做错了什么?如何在 MySQL Workbench 脚本中引用 .sql 文件?
我应该在 MySQL Workbench 中使用什么代码来代替source?我已经尝试过LOAD DATA LOCAL INFILE 'C:/Users/[username]/Desktop/sampdb/create_president.sql';,但也没有成功。知道会出什么问题吗?
*仅供参考,create_president.sql 包含以下代码:
DROP TABLE IF EXISTS president;
#@ _CREATE_TABLE_
CREATE TABLE president
(
last_name VARCHAR(15) NOT NULL,
first_name VARCHAR(15) NOT NULL,
suffix VARCHAR(5) NULL,
city VARCHAR(20) NOT NULL,
state VARCHAR(2) NOT NULL,
birth DATE NOT NULL,
death DATE NULL …Run Code Online (Sandbox Code Playgroud) 我正在估计带有包装的面板模型plm。小组中的一些人没有所有解释变量的数据,因此他们被排除在回归之外。我如何才能看到哪些特定观测值已用于估计?
在 Stata 中常用的命令是e(sample). R 中的等价物是什么?