假设我在R中有一个日期,其格式如下.
date
2012-02-01
2012-02-01
2012-02-02
Run Code Online (Sandbox Code Playgroud)
在R中是否有任何方法可以添加与日期相关的星期几的另一列?数据集非常大,因此手动完成并进行更改是没有意义的.
df = data.frame(date=c("2012-02-01", "2012-02-01", "2012-02-02"))
Run Code Online (Sandbox Code Playgroud)
因此,在添加日期之后,它最终会看起来像:
date day
2012-02-01 Wednesday
2012-02-01 Wednesday
2012-02-02 Thursday
Run Code Online (Sandbox Code Playgroud)
这可能吗?任何人都可以指向我一个允许我这样做的包吗?只是尝试按日期自动生成日期.
假设我有一个两个单词的字符串,我想把它们都大写.
name <- c("zip code", "state", "final count")
Run Code Online (Sandbox Code Playgroud)
这个Hmisc包有一个capitalize大写第一个单词的函数,但我不确定如何将第二个单词大写.帮助页面capitalize并不表示它可以执行该任务.
library(Hmisc)
capitalize(name)
# [1] "Zip code" "State" "Final count"
Run Code Online (Sandbox Code Playgroud)
我想得到:
c("Zip Code", "State", "Final Count")
Run Code Online (Sandbox Code Playgroud)
三字串怎么样:
name2 <- c("I like pizza")
Run Code Online (Sandbox Code Playgroud) 我有一个数字向量,一个,我试图变成一个字符向量,其中每个元素用逗号分隔.
> one = c(1:5)
> paste(as.character(one), collapse=", ")
[1] "1, 2, 3, 4, 5"
> paste(as.character(one), sep="' '", collapse=", ")
[1] "1, 2, 3, 4, 5"
Run Code Online (Sandbox Code Playgroud)
但是,我希望输出看起来像:
"1", "2", "3", "4", "5"
Run Code Online (Sandbox Code Playgroud)
我错过了粘贴功能中的一些参数吗?救命!?
我正在做一个水平点图(?)ggplot2,它让我考虑尝试创建一个水平的条形图.但是,我发现能够做到这一点有一些限制.
这是我的数据:
df <- data.frame(Seller=c("Ad","Rt","Ra","Mo","Ao","Do"),
Avg_Cost=c(5.30,3.72,2.91,2.64,1.17,1.10), Num=c(6:1))
df
str(df)
Run Code Online (Sandbox Code Playgroud)
最初,我使用以下代码生成了一个点图:
require(ggplot2)
ggplot(df, aes(x=Avg_Cost, y=reorder(Seller,Num))) +
geom_point(colour="black",fill="lightgreen") +
opts(title="Avg Cost") +
ylab("Region") + xlab("") + ylab("") + xlim(c(0,7)) +
opts(plot.title = theme_text(face = "bold", size=15)) +
opts(axis.text.y = theme_text(family = "sans", face = "bold", size = 12)) +
opts(axis.text.x = theme_text(family = "sans", face = "bold", size = 12))
Run Code Online (Sandbox Code Playgroud)
但是,我现在正在尝试创建一个水平条形图,并发现我无法这样做.我试过了coord_flip(),这也没有帮助.
ggplot(df, aes(x=Avg_Cost, y=reorder(Seller,Num))) +
geom_bar(colour="black",fill="lightgreen") +
opts(title="Avg Cost") +
ylab("Region") + xlab("") + ylab("") + xlim(c(0,7)) + …Run Code Online (Sandbox Code Playgroud) 好吧,假设我有以下情节.
df = data.frame(date=c(rep(2008:2013, by=1)),
value=c(303,407,538,696,881,1094))
barplot(df$value, main="TITLE", col="gray", ylab="People", xlab="Years")
Run Code Online (Sandbox Code Playgroud)
如何将背景更改为深蓝色?
我知道这可以用ggplot2,但不知道我是否可以用基本图形做到这一点.
所以这是一个非常简单的问题,似乎无法弄明白.
我正在使用glm函数运行logit,但不断收到与自变量相关的警告消息.它们被存储为因素,我已将它们更改为数字,但没有运气.我也将它们编码为0/1,但这也没有用.
请帮忙!
> mod2 <- glm(winorlose1 ~ bid1, family="binomial")
Warning messages:
1: glm.fit: algorithm did not converge
2: glm.fit: fitted probabilities numerically 0 or 1 occurred
Run Code Online (Sandbox Code Playgroud)
我也在Zelig尝试过,但类似的错误:
> mod2 = zelig(factor(winorlose1) ~ bid1, data=dat, model="logit")
How to cite this model in Zelig:
Kosuke Imai, Gary King, and Oliva Lau. 2008. "logit: Logistic Regression for Dichotomous Dependent Variables" in Kosuke Imai, Gary King, and Olivia Lau, "Zelig: Everyone's Statistical Software," http://gking.harvard.edu/zelig
Warning messages:
1: glm.fit: algorithm did not converge
2: …Run Code Online (Sandbox Code Playgroud) 所以我有四张桌子.每个表都有一个前一个表id的id.所以我在点击表中有一个ID和一个ID来自它的广告.在广告表中,它具有广告ID和来自广告系列的ID.所以这是一个例子.
Table4 -
id company table_id
11 hp 20
12 apple 23
13 kohls 26
14 target 21
15 borders 28
Table3 -
id value table2_id
21 ks 53
22 al 54
23 tx 53
24 fl 55
25 co 51
Table2 -
id value table1_id
51 ks 34
52 al 34
53 tx 33
54 fl 35
55 co 31
Table1 -
id value
31 ks
32 al
33 tx
34 fl
35 co
Run Code Online (Sandbox Code Playgroud)
因此,为了找出表4中的值来自何处,我需要回顾每个表并检查它们具有哪个ID.基本上,我想知道表1中的哪些值与表4中的值相关联.
表4作为网站访问者和表1作为互联网广告.我想知道哪些访问者来自哪些广告.不幸的是,数据已设置好,因此我只能从访问者到源代码,广告组再到广告.那有意义吗?
无论如何,我想知道是否使用4个内部连接是这个问题的最佳策略,还是有一些我不知道的更简单的mysql解决方案.
假设我有一个包含以下值的表.
Ford
Ford
Ford
Honda
Chevy
Honda
Honda
Chevy
Run Code Online (Sandbox Code Playgroud)
所以我想构造以下输出.
Ford 3
Honda 3
Chevy 2
Run Code Online (Sandbox Code Playgroud)
它只需要列中每个元素的计数.
我有一个列出唯一列的问题.
谁能告诉我怎么做?
我搞砸周围UNIQUE和DISTINCT,但我没能得到左边的值的列表.
我是R新手并且有一个问题.我试图将一些文本放入R图中.这是使用UsingR包中的亮度数据集的一些代码.
library(UsingR)
brightness
MyMean <- mean(brightness)
MyMedian <- median(brightness)
MySd <- sd(brightness)
hist(brightness, breaks=35, main="This is a Histogram",
xlab="Brightness", ylab="Frequency", xlim=c(0,15), ylim=c(0, 200))
text(3.5, 150, paste("Mean =", round(MyMean, 1), "\n Median =",
round(MyMedian, 1), "\n Std.Dev =", round(MySd, 1)))
Run Code Online (Sandbox Code Playgroud)
此代码生成:

此输出的问题是文本未左对齐.有谁知道如何使文本保持对齐.
谢谢.
我有一个字符向量,其中每个元素都用括号括起来.我想删除括号,只是有字符串.
所以我尝试过:
n = c("[Dave]", "[Tony]", "[Sara]")
paste("", n, "", sep="")
Run Code Online (Sandbox Code Playgroud)
不幸的是,由于某些原因,这不起作用.
我在使用相同的代码之前执行了相同的任务,并且不确定为什么这次没有工作.
我想从去'[Dave]'到'Dave'.
我究竟做错了什么?