小编Obs*_*ver的帖子

在ggplot的geom_density()中为每个分位数填充不同的颜色

我正在使用ggplot来显示数据的百分位数.我使用以下代码,

data <- seq(from=0,to=30,length.out=1000)

q <- quantile(data)

ggplot()+ 
  geom_density(aes(x=data)) +  
  annotate(geom="text", x=q, y=0, label=names(q)) +
  theme(text = element_text(size=10)) +
  geom_vline(x=q, linetype = "longdash")

Run Code Online (Sandbox Code Playgroud)

以下是我得到的图表,

我希望为每个细分填充不同的颜色.即一种颜色为0-25%,另一种颜色为25-50%.有可能吗？

垂直线也贯穿整个图形.我想阻止它直到曲线.而不是完全贯穿它.

谁能帮助我做这两件事？

r ggplot2

Obs*_*ver

2015 12-02

6
推荐指数

1
解决办法

6067
查看次数

回归分析未显示摘要

以下是我的数据

> x
          day  sum
1  2015-04-14  129
2  2015-04-15  129
3  2015-04-16  129
4  2015-04-17  899
5  2015-04-18  899
6  2015-04-19  899
7  2015-04-20  899
8  2015-04-21  899
9  2015-04-22  899
10 2015-04-23  899
11 2015-04-24  899
12 2015-04-25  899
13 2015-04-26  899
14 2015-04-27  899
15 2015-04-28  899
16 2015-04-29  899
17 2015-04-30  899
18 2015-05-01  899
19 2015-05-02  899
20 2015-05-03  899
21 2015-05-04  899
22 2015-05-05  899
23 2015-05-06  899
24 2015-05-07  899
25 2015-05-08  899 …

Run Code Online (Sandbox Code Playgroud)

regression r time-series

Obs*_*ver

2017 05-23

4
推荐指数

1
解决办法

6635
查看次数

从Dataframe - Pandas中的所有列的列名中删除最后两个字符

我使用用户ID密钥加入具有相同列/列名称的两个数据帧(a,b),并且在加入时,我必须提供后缀字符,以便创建它.以下是我使用的命令,

a.join(b,how='inner', on='userId',lsuffix="_1")

Run Code Online (Sandbox Code Playgroud)

如果我不使用这个后缀,我会收到错误.但我不希望列名更改,因为这会导致运行其他分析时出现问题.所以我想从结果数据帧的所有列名中删除这个"_1"字符.任何人都可以建议我删除Pandas数据帧中所有列的最后两个字符的有效方法吗？

谢谢

python string dataframe pandas

Obs*_*ver

2019 05-22

4
推荐指数

1
解决办法

6903
查看次数

在 Hive 中处理正则表达式中的多个匹配项

我想在 Hive 中的表达式中解析出负十进制值，并且我编写了以下正则表达式，

select regexp_extract("abcsdfghj-117.3700631&poikse-118.244&",
'([-][1-9][0-9]*[.][0-9]+)&*') as output

Run Code Online (Sandbox Code Playgroud)

虽然正则表达式似乎运行良好，但它只给了我第一个匹配项。是否有可能让 hive 给出所有可能的组合？hive 中是否有任何函数可以返回所有匹配项？

我做了谷歌这个，我无法找到任何答案。任何帮助，将不胜感激

谢谢

regex hadoop hive

Obs*_*ver

2017 02-09

2
推荐指数

1
解决办法

5402
查看次数

标签统计

r ×2

dataframe ×1

ggplot2 ×1

hadoop ×1

hive ×1

pandas ×1

python ×1

regex ×1

regression ×1

string ×1

time-series ×1

在ggplot的geom_density()中为每个分位数填充不同的颜色

回归分析未显示摘要

从Dataframe - Pandas中的所有列的列名中删除最后两个字符

在 Hive 中处理正则表达式中的多个匹配项

标签 统计

小编Obs_ver的帖子

标签统计