小编ATM*_*hew的帖子

找到一周的一天

假设我在R中有一个日期,其格式如下.

   date      
2012-02-01 
2012-02-01
2012-02-02
Run Code Online (Sandbox Code Playgroud)

在R中是否有任何方法可以添加与日期相关的星期几的另一列?数据集非常大,因此手动完成并进行更改是没有意义的.

df = data.frame(date=c("2012-02-01", "2012-02-01", "2012-02-02")) 
Run Code Online (Sandbox Code Playgroud)

因此,在添加日期之后,它最终会看起来像:

   date       day
2012-02-01   Wednesday
2012-02-01   Wednesday
2012-02-02   Thursday
Run Code Online (Sandbox Code Playgroud)

这可能吗?任何人都可以指向我一个允许我这样做的包吗?只是尝试按日期自动生成日期.

r date r-faq

200
推荐指数
6
解决办法
20万
查看次数

将两个单词的第一个字母大写为两个单词的字符串

假设我有一个两个单词的字符串,我想把它们都大写.

name <- c("zip code", "state", "final count")
Run Code Online (Sandbox Code Playgroud)

这个Hmisc包有一个capitalize大写第一个单词的函数,但我不确定如何将第二个单词大写.帮助页面capitalize并不表示它可以执行该任务.

library(Hmisc)
capitalize(name)
# [1] "Zip code"    "State"       "Final count"
Run Code Online (Sandbox Code Playgroud)

我想得到:

c("Zip Code", "State", "Final Count")
Run Code Online (Sandbox Code Playgroud)

三字串怎么样:

name2 <- c("I like pizza")
Run Code Online (Sandbox Code Playgroud)

string title-case r

165
推荐指数
10
解决办法
10万
查看次数

创建逗号分隔的矢量

我有一个数字向量,一个,我试图变成一个字符向量,其中每个元素用逗号分隔.

> one = c(1:5)
> paste(as.character(one), collapse=", ")
[1] "1, 2, 3, 4, 5"
> paste(as.character(one), sep="' '", collapse=", ")
[1] "1, 2, 3, 4, 5"
Run Code Online (Sandbox Code Playgroud)

但是,我希望输出看起来像:

"1", "2", "3", "4", "5" 
Run Code Online (Sandbox Code Playgroud)

我错过了粘贴功能中的一些参数吗?救命!?

r

76
推荐指数
4
解决办法
7万
查看次数

ggplot2中的水平条形图

我正在做一个水平点图(?)ggplot2,它让我考虑尝试创建一个水平的条形图.但是,我发现能够做到这一点有一些限制.

这是我的数据:

df <- data.frame(Seller=c("Ad","Rt","Ra","Mo","Ao","Do"), 
                Avg_Cost=c(5.30,3.72,2.91,2.64,1.17,1.10), Num=c(6:1))
df
str(df)
Run Code Online (Sandbox Code Playgroud)

最初,我使用以下代码生成了一个点图:

require(ggplot2)
ggplot(df, aes(x=Avg_Cost, y=reorder(Seller,Num))) + 
    geom_point(colour="black",fill="lightgreen") + 
    opts(title="Avg Cost") +
    ylab("Region") + xlab("") + ylab("") + xlim(c(0,7)) +
    opts(plot.title = theme_text(face = "bold", size=15)) +
    opts(axis.text.y = theme_text(family = "sans", face = "bold", size = 12)) +
    opts(axis.text.x = theme_text(family = "sans", face = "bold", size = 12))
Run Code Online (Sandbox Code Playgroud)

但是,我现在正在尝试创建一个水平条形图,并发现我无法这样做.我试过了coord_flip(),这也没有帮助.

ggplot(df, aes(x=Avg_Cost, y=reorder(Seller,Num))) + 
    geom_bar(colour="black",fill="lightgreen") + 
    opts(title="Avg Cost") +
    ylab("Region") + xlab("") + ylab("") + xlim(c(0,7)) + …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

50
推荐指数
1
解决办法
8万
查看次数

更改R图的背景颜色

好吧,假设我有以下情节.

df = data.frame(date=c(rep(2008:2013, by=1)),
                value=c(303,407,538,696,881,1094))

barplot(df$value, main="TITLE", col="gray", ylab="People", xlab="Years")
Run Code Online (Sandbox Code Playgroud)

如何将背景更改为深蓝色?

我知道这可以用ggplot2,但不知道我是否可以用基本图形做到这一点.

plot r

37
推荐指数
2
解决办法
8万
查看次数

为什么我得到"算法没有收敛"和用glm"用数字0或1拟合概率"警告?

所以这是一个非常简单的问题,似乎无法弄明白.

我正在使用glm函数运行logit,但不断收到与自变量相关的警告消息.它们被存储为因素,我已将它们更改为数字,但没有运气.我也将它们编码为0/1,但这也没有用.

请帮忙!

> mod2 <- glm(winorlose1 ~ bid1, family="binomial")
Warning messages:
1: glm.fit: algorithm did not converge 
2: glm.fit: fitted probabilities numerically 0 or 1 occurred 
Run Code Online (Sandbox Code Playgroud)

我也在Zelig尝试过,但类似的错误:

> mod2 = zelig(factor(winorlose1) ~ bid1, data=dat, model="logit")
How to cite this model in Zelig:
Kosuke Imai, Gary King, and Oliva Lau. 2008. "logit: Logistic Regression for Dichotomous Dependent Variables" in Kosuke Imai, Gary King, and Olivia Lau, "Zelig: Everyone's Statistical Software," http://gking.harvard.edu/zelig
Warning messages:
1: glm.fit: algorithm did not converge 
2: …
Run Code Online (Sandbox Code Playgroud)

statistics r r-zelig

33
推荐指数
2
解决办法
6万
查看次数

具有多个表的多个内部联接

所以我有四张桌子.每个表都有一个前一个表id的id.所以我在点击表中有一个ID和一个ID来自它的广告.在广告表中,它具有广告ID和来自广告系列的ID.所以这是一个例子.

Table4 -
id   company      table_id
11     hp           20
12     apple        23
13     kohls        26  
14     target       21
15     borders      28

Table3 - 
id    value    table2_id
21     ks          53
22     al          54
23     tx          53 
24     fl          55
25     co          51

Table2 -
id    value    table1_id
51     ks          34
52     al          34
53     tx          33 
54     fl          35
55     co          31

Table1 -
id    value    
31     ks        
32     al          
33     tx          
34     fl          
35     co  
Run Code Online (Sandbox Code Playgroud)

因此,为了找出表4中的值来自何处,我需要回顾每个表并检查它们具有哪个ID.基本上,我想知道表1中的哪些值与表4中的值相关联.

表4作为网站访问者和表1作为互联网广告.我想知道哪些访问者来自哪些广告.不幸的是,数据已设置好,因此我只能从访问者到源代码,广告组再到广告.那有意义吗?

无论如何,我想知道是否使用4个内部连接是这个问题的最佳策略,还是有一些我不知道的更简单的mysql解决方案.

mysql sql join inner-join

30
推荐指数
1
解决办法
8万
查看次数

使用Count查找出现次数

假设我有一个包含以下值的表.

Ford
Ford
Ford
Honda
Chevy
Honda
Honda
Chevy
Run Code Online (Sandbox Code Playgroud)

所以我想构造以下输出.

Ford   3
Honda  3
Chevy  2
Run Code Online (Sandbox Code Playgroud)

它只需要列中每个元素的计数.

我有一个列出唯一列的问题.

谁能告诉我怎么做?

我搞砸周围UNIQUEDISTINCT,但我没能得到左边的值的列表.

mysql sql group-by

26
推荐指数
2
解决办法
6万
查看次数

对齐图中的文本

我是R新手并且有一个问题.我试图将一些文本放入R图中.这是使用UsingR包中的亮度数据集的一些代码.

    library(UsingR)
    brightness

    MyMean <- mean(brightness)
    MyMedian <- median(brightness)
    MySd <- sd(brightness)

    hist(brightness, breaks=35, main="This is a Histogram", 
         xlab="Brightness", ylab="Frequency", xlim=c(0,15), ylim=c(0, 200))

    text(3.5, 150, paste("Mean =", round(MyMean, 1), "\n Median =", 
         round(MyMedian, 1), "\n Std.Dev =", round(MySd, 1)))
Run Code Online (Sandbox Code Playgroud)

此代码生成:

在此输入图像描述

此输出的问题是文本未左对齐.有谁知道如何使文本保持对齐.

谢谢.

text r text-alignment

24
推荐指数
2
解决办法
6万
查看次数

从字符串向量中删除方括号

我有一个字符向量,其中每个元素都用括号括起来.我想删除括号,只是有字符串.

所以我尝试过:

n = c("[Dave]", "[Tony]", "[Sara]")

paste("", n, "", sep="")
Run Code Online (Sandbox Code Playgroud)

不幸的是,由于某些原因,这不起作用.

我在使用相同的代码之前执行了相同的任务,并且不确定为什么这次没有工作.

我想从去'[Dave]''Dave'.

我究竟做错了什么?

regex string r

24
推荐指数
4
解决办法
3万
查看次数

标签 统计

r ×8

mysql ×2

sql ×2

string ×2

date ×1

ggplot2 ×1

group-by ×1

inner-join ×1

join ×1

plot ×1

r-faq ×1

r-zelig ×1

regex ×1

statistics ×1

text ×1

text-alignment ×1

title-case ×1