小编dat*_*oda的帖子

Date        |  Keyword  |  Score    
2012-01-10  |  ipad     |  0.12    
2012-01-11  |  ipad     |  0.17    
2012-01-12  |  ipad     |  0.24    
2012-01-10  |  taco     |  0.19    
2012-01-11  |  taco     |  0.34    
2012-01-12  |  taco     |  0.45

Run Code Online (Sandbox Code Playgroud)

我想通过使用SQL创建一个新表来使最终输出看起来像这样:

Date        |  Keyword  |  Score |  Slope    
2012-01-10  |  ipad     |  0.12  |  0.06    
2012-01-11  |  ipad     |  0.17  |  0.06    
2012-01-12  |  ipad     |  0.24  |  0.06    
2012-01-10  |  taco     |  0.19  |  0.13    
2012-01-11  |  taco     |  0.34  |  0.13    
2012-01-12 …

Run Code Online (Sandbox Code Playgroud)

mysql sql oracle10g

dat*_*oda

2012 02-01

14
推荐指数

1
解决办法

1万
查看次数

如何在R中复制月度周期图表

我想输出一个类似于本页(右侧)所示的图表,使用R和任何可以使它看起来很好的包:

http://processtrends.com/pg_charts_monthly_cycle_chart.htm

有谁接受挑战？:)

谢谢!

plot r ggplot2

dat*_*oda

2011 04-29

11
推荐指数

2
解决办法

3940
查看次数

计算连续密度图下的面积

我用这个绘制了两条密度曲线:

Network <- Mydf$Networks
quartiles <-  quantile(Mydf$Avg.Position,  probs=c(25,50,75)/100)
density <- ggplot(Mydf, aes(x = Avg.Position, fill = Network))
d <- density + geom_density(alpha = 0.2) + xlim(1,11) + opts(title = "September 2010") + geom_vline(xintercept = quartiles, colour = "red")
print(d)

Run Code Online (Sandbox Code Playgroud)

我想为给定的Avg.Position范围计算每条曲线下的面积.有点像普通曲线的pnorm.有任何想法吗？

curve r area ggplot2

dat*_*oda

2012 05-07

4
推荐指数

2
解决办法

7499
查看次数

根据其他值添加列

我有一个包含数百万行和三列标记为关键字,展示次数,点击次数的数据框.我想根据此函数的评估添加一个包含值的列:

isType <- function(Impressions, Clicks)
{ 
if (Impressions >= 1 & Clicks >= 1){return("HasClicks")} else if (Impressions >=1 & Clicks == 0){return("NoClicks")} else {return("ZeroImp")}
}

Run Code Online (Sandbox Code Playgroud)

到现在为止还挺好.然后我尝试这个来创建列,但1)它需要永远和2)它标记所有行有"HasClicks"甚至是它不应该的那些.

# Creates a dataframe
Type <- data.frame()
# Loops until last row and store it in data.frame
for (i in c(1:dim(Mydf)[1])) {Type <- rbind(Type,isType(Mydf$Impressions[i], Mydf$Clicks[i]))}
# Add the column to Mydf
Mydf <- transform(Mydf, Type = Type)

Run Code Online (Sandbox Code Playgroud)

输入数据:

关键字,展示次数,点击次数
"Hello",0,0
"World",1,0
"R",34,23

通缉输出:

关键字,展示次数,点击次数,输入
"Hello",0,0,"ZeroImp"
"World",1,0,"NoClicks"
"R",34,23,"HasClicks"

dat*_*oda

2010 10-13

4
推荐指数

1
解决办法

8223
查看次数

使用特殊格式从URL结果中提取数据

我有一个URL:http:
//somewhere.com/relatedqueries？limit = 2&query = setermterm

修改输入,限制和查询的位置将生成所需数据.限制是可能的最大术语数,查询是种子术语.

URL提供以这种方式格式化的文本结果:
oo.visualization.Query.setResponse({version:'0.5',reqId:'0',status:'ok',sig:'1303596067112929220',table:{cols:[{ ID: '得分',标签: '得分',类型: '编号',图案: '#,## 0 ###'},{ID: '查询',标签: '查询',类型:'字符串'图案: ''}],行:[{C:[{ν:0.9894380670262618中,f: '0.99'},{ν: 'newterm1'}]},{C:[{ν:0.9894380670262618,F:' 0.99 '},{v:' newterm2 '}]}],p:{' totalResultsCount ':' 7727' }}});

我想编写一个带有两个参数(限制数和查询种子)的python脚本,在线获取数据,解析结果并返回一个包含新术语['newterm1','newterm2']的列表案件.

我喜欢一些帮助,尤其是URL提取,因为我以前从未这样做过.

python url parsing

dat*_*oda

2017 01-02

4
推荐指数

1
解决办法

2万
查看次数

向ggplot2 dotplot添加另一个维度/变量

这应该很容易,但它让我发疯.

我有一些形式的数据:

类别,RetailCPC,AdvertiserCPC
花,0.2,0.25
鞋,0.4,0.1

我试图显示一个每行2个点的点图,并由RetailCPC使用ggplot2订购.

我可以绘制一个维度(我的意思是RetailCPC数据),如下所示:

Mydf$Categories <- reorder(Mydf$Categories, Mydf$RetailCPC)
require(ggplot2) 
p1 <- qplot(RetailCPC, Categories, data = Mydf)
p1 + geom_point(colour = "red", size = 2)

Run Code Online (Sandbox Code Playgroud)

如何添加AdvertiserCPC点？

r ggplot2

dat*_*oda

lucky-day

2
推荐指数

1
解决办法

480
查看次数