我有清除工作区的rm(list=ls())
代码:以及清除控制台的代码:cat("\014")
是否有代码清除Rstudio的所有情节?
我正在尝试将我的数据框中的两列转换为"好"的日期和时间类,直到现在它并没有取得多大成功.我已经试过各种类别(timeDate
,Date
,timeSeries
,POSIXct
,POSIXlt
),但没有成功.也许我只是忽略了显而易见的事情,因为我已经尝试了很多方法,我只是不知道它是什么了.我希望你们中的一些人可以了解我哪里出错了.
目标:我想使用最早和最晚的日期来计算两个日期之间的差异.我得到了这个head()
和tail()
,但由于这些值不是我数据中最早和最晚的日期,我需要另一种方式.(我无法对数据进行排序,因为它只在日期当天对数据进行排序.)
第二个目标:我想将日期格式(即8-12-2010)转换为每周,每月和每年的水平(即'49 -2010','12月10',以及'2010').这可以通过格式设置(如%d-%m-%y
)完成.这可以通过将data.frame转换为时间类,然后以正确的格式(8-12-2010 -> format("%B-%y") -> 'december-10'
转换时间类,然后将该时间类转换为每个月的级别因子来完成吗?
对于这两个目标,我需要将日期框架以某种方式转换为时间类,这就是我遇到一些困难的地方.
我的数据框看起来像这样:
> tradesList[c(1,10,11,20),14:15] -> tmpTimes4
> tmpTimes4
EntryTime ExitTime
1 01-03-07 10-04-07
10 29-10-07 02-11-07
11 13-04-07 14-05-07
20 18-12-07 20-02-08
Run Code Online (Sandbox Code Playgroud)
以下是我尝试过的摘要:
> class(tmpTimes4)
[1] "data.frame"
> as.Date(head(tmpTimes4$EntryTimes, n=1), format="%d-%m-%y")
Error in as.Date.default(head(tmpTimes4$EntryTimes, n = 1), format = "%d-%m-%y") :
do not know how to convert 'head(tmpTimes4$EntryTimes, n = 1)' to …
Run Code Online (Sandbox Code Playgroud) 我的目标是在包中ggplot
使用并将它们组合成一个单独的绘图.grid.arrange
gridExtra
我有一个问题,因为ggplot
当我试图将这些地块并排放置时,我的传说(虽然适合单个地块的尺寸)太大了grid.arrange
.生成的组合图减少了x轴,但保留了图例的原始大小.所以结果是一个非常瘦的情节,旁边是一个不必要的大传奇.所以我想减少每个情节中图例的大小,足以让我可以并排放置我的情节.或者可能会缩小它们以使它们进入实际的情节而不会过度专注.
V1<-rnorm(10)
V2<-rnorm(10)
V3<-rnorm(10)
DF<-data.frame(V1,V2,V3)
ggplot(DF,aes(x=V1,y=V2,size=V3))+
geom_point(fill='red',shape=21)+
theme_bw()+
scale_size(range=c(5,20))
Run Code Online (Sandbox Code Playgroud)
此绘图命令在绘图右侧生成标准图例大小.
我尝试过使用不同的主题元素:
+theme(legend.key.size = unit(0.5, "cm")
Run Code Online (Sandbox Code Playgroud)
要么
+theme(legend.key.width=unit(0.3,"cm"),legend.key.height=unit(0.3,"cm"),legend.position = c(0.7, 0.8))
Run Code Online (Sandbox Code Playgroud)
虽然我可以使用这些主题命令使图例更大,但我不能使图例小于默认图例.那么有没有办法将图例缩小到超出默认大小?
我还可以更改我的pdf设备的默认大小,使其更宽,并适应大型传说,但我现在想使用标准的pdf大小.
我该怎么办这个错误?我的代码是:
library(e1071)
library(hydroGOF)
donnees <- read.csv("F:/new work with shahab/Code-SVR/SVR/MainData.csv")
summary(donnees)
#partitioning into training and testing set
donnees.train <- donnees[donnees$subset=="train",2:ncol(donnees)]
donnees.test <- donnees[donnees$subset=="test",2:ncol(donnees)]
#use the mean of the dependent variable as a predictor
def.pred <- mean(donnees.train$y)
#error sum of squares of the default model on the test set
def.rss <- sum((donnees.test$y-def.pred)^2)
print(def.rss)
plot(donnees.train)
#*****************
#linear regression
#*****************
#Linear Models
reg <- lm(y ~., data = donnees.train)
print(summary(reg))
#error sum of squares of the model on the test set
reg.pred <- predict(reg,newdata …
Run Code Online (Sandbox Code Playgroud) 我对编程很新,也对data.table
R 很新- 所以也许这个问题非常简单,但我搜索过并找不到任何解决方案.
我试图成对匹配4个变量并添加一个具有查找值的列.在基地,我会做merge(df1,df2, by.x=c("lsr","ppr"),by.y=c("li","pro"))
,df1
有9个cols,df2
(2个lsr
和pro
)df2
只有3个li
,pro
和我感兴趣的"价值",alpha
.
这很好,但是当我开始成为一个巨大的粉丝时data.table
,我想这样做data.table
- 因为我有几百万行 - 所以基本合并很慢(我看到,这个by.x
和by.y
功能是等待data.table
,但也许有一个解决方法).请参阅以下示例数据:
df2:
alpha li pro
1: 0.5000000 0.01666667 0.01666667
2: 0.3295455 0.03333333 0.01666667
3: 0.2435897 0.05000000 0.01666667
4: 0.1917808 0.06666667 0.01666667
5: 0.1571429 0.08333333 0.01666667
df1:
demand rtime mcv mck ppr mlv mlk lsr
1: 0.3 1 357.57700 0.099326944 0.01666667 558.27267 0.155075741 …
Run Code Online (Sandbox Code Playgroud) 我有我在,我想一个数据点的工作比较数据帧Genotype
有两个参考S288C
和SK1
.这种比较将在数据帧的许多行(100+)上完成.以下是我的数据框的前几行:
Assay Genotype S288C SK1
1 CCT6-002 G A G
2 CCT6-007 G A G
3 CCT6-013 C T C
4 CCT6-015 G A G
5 CCT6-016 G G T
Run Code Online (Sandbox Code Playgroud)
作为最终产品,我想要一个1(S288C
)和0(SK1
)的字符串,具体取决于数据点匹配的引用.因此,在上面的例子中,我想要00001
除了最后一个匹配以外的所有输出SK1
.
我在运行下面的代码时收到错误消息 - 我希望在pdf中运行并显示,但是在r中返回错误并且代码不会运行.
{r, warning=TRUE}
library(survey)
debug(withReplicates.svyrep.design)
我试过warning=TRUE
但这不起作用.
如何获取文档中显示的错误?
我有一个如下所示的数据框:
> df = data.frame(group = c(1,1,1,2,2,2,3,3,3),
date = c(1,2,3,4,5,6,7,8,9),
value = c(3,4,3,4,5,6,6,4,9))
> df
group date value
1 1 1 3
2 1 2 4
3 1 3 3
4 2 4 4
5 2 5 5
6 2 6 6
7 3 7 6
8 3 8 4
9 3 9 9
Run Code Online (Sandbox Code Playgroud)
我想创建一个新列,其中包含与值列中的值"4"关联的每个组的日期值.
以下数据框显示了我希望实现的目标.
group date value newValue
1 1 1 3 2
2 1 2 4 2
3 1 3 3 2
4 2 4 4 4 …
Run Code Online (Sandbox Code Playgroud) 应该可以使用 Quarto 创建一个独立的 HTML 文件
format:
html:
embed-resources: true
Run Code Online (Sandbox Code Playgroud)
如此处所述:
https://quarto.org/docs/output-formats/html-basics.html#self-contained,但是当我尝试通过电子邮件发送生成的 HTML 文件时,图表不会出现,如下图所示 -
我得到一个文件夹和 HTML 文件
(我认为它上周有效,我不确定,但我确实得到了一个独立的文件)。
难道我做错了什么?
微量元素:
---
title: "foo"
format:
html:
embed-resources: true
---
```{r}
library(ggplot2)
mtcars |>
ggplot(aes(mpg, disp)) +
geom_point()
```
Run Code Online (Sandbox Code Playgroud)
使用system("quarto render elevators.qmd --output elevators.html")
给出相同的结果。
我有如下的data.frame
ID country age
1 X 83
2 X 15
3 Y 2
4 Y 12
5 X 2
6 Y 2
7 Y 18
8 X 85
Run Code Online (Sandbox Code Playgroud)
我需要过滤年龄在10岁以下且同时在80岁以上的行。如何以最简单的方式进行过滤?对于一个条件,我可以使用,filter(data.frame, age > 80)
但是我不知道如何同时在两个条件下使用它?