小编nau*_*101的帖子

如何将data.frame分组几周然后求和?

假设我有几年的数据,如下所示

# load date package and set random seed
library(lubridate)
set.seed(42)

# create data.frame of dates and income
date <- seq(dmy("26-12-2010"), dmy("15-01-2011"), by = "days")
df <- data.frame(date = date, 
                 wday = wday(date),
                 wday.name = wday(date, label = TRUE, abbr = TRUE),
                 income = round(runif(21, 0, 100)),
                 week = format(date, format="%Y-%U"),
                 stringsAsFactors = FALSE)

#          date wday wday.name income    week
# 1  2010-12-26    1       Sun     91 2010-52
# 2  2010-12-27    2       Mon     94 2010-52
# 3  2010-12-28    3      Tues     29 …
Run Code Online (Sandbox Code Playgroud)

datetime r dataframe

8
推荐指数
3
解决办法
1万
查看次数

使用ggplot2绘制每x值的数据集的平均值和sd

我有一个看起来像这样的数据集:

a <- data.frame(x=rep(c(1,2,3,5,7,10,15,20), 5),
                y=rnorm(40, sd=2) + rep(c(4,3.5,3,2.5,2,1.5,1,0.5), 5))
ggplot(a, aes(x=x,y=y)) + geom_point() +geom_smooth()
Run Code Online (Sandbox Code Playgroud)

图输出

我想要与该绘图相同的输出,但不是平滑曲线,我只想在每组x值的均值/ sd值之间取线段.该图应该与上图类似,但是锯齿状,而不是弯曲的.

我试过这个,但它失败了,即使x值不是唯一的:

ggplot(a, aes(x=x,y=y)) + geom_point() +stat_smooth(aes(group=x, y=y, x=x))
geom_smooth: Only one unique x value each group.Maybe you want aes(group = 1)?
Run Code Online (Sandbox Code Playgroud)

r ggplot2

8
推荐指数
2
解决办法
1万
查看次数

匿名一个本地git存储库?

我有一个本地git存储库,我已经做了很多工作,我希望保留一些提交.不幸的是,虽然代码是合理的可重用的,但我在很早的提交中包含了一些敏感数据(数据库名称/用户/密码).我想更改整个历史记录以匿名敏感数据,同时保留一般历史记录结构.这可能吗?如果是这样,怎么样?

git anonymity

7
推荐指数
1
解决办法
149
查看次数

将日期时间格式化为R中的季节?

在R中,可以将POSIXlt日期时间对象格式化为一个月:

format(Sys.time(), format='%Y-%m')
Run Code Online (Sandbox Code Playgroud)

有没有办法在季节或3个月组(DJF,MAM,JJA,SON)做同样的事情?这些分歧在气候学和生态科学中非常普遍,如果用几个月的话,用一种简洁的方法来快速形成它们就会很棒.显然DJF超过2年,但出于目的或这个问题,这并不重要 - 只是一直把它们推到任一年,(或者,理想情况下,能够指定他们进入哪一年会很好) .

我使用输出作为索引by(),因此输出格式无关紧要,只要每年/每季都是唯一的.

编辑:示例数据:

dates <- Sys.Date()+seq(1,380, by=35)
dates <- structure(c(16277, 16312, 16347, 16382, 16417, 16452, 16487, 
                     16522, 16557, 16592, 16627), class = "Date")
dates
#[1] "2014-07-26" "2014-08-30" "2014-10-04" "2014-11-08" "2014-12-13"
# "2015-01-17" "2015-02-21" "2015-03-28" "2015-05-02" "2015-06-06" "2015-07-11"
Run Code Online (Sandbox Code Playgroud)

应该导致:

c("2014-JJA", "2014-JJA", "2014-SON", "2014-SON", "2015-DJF", "2015-DJF", 
  "2015-DJF", "2015-MAM", "2015-MAM", "2015-JJA", "2015-JJA")
Run Code Online (Sandbox Code Playgroud)

但"2015-DJF"也可能是"2014-DJF".此外,输出的形式无关紧要 - "2104q4或201404也没关系.

datetime r datetime-format

7
推荐指数
1
解决办法
2185
查看次数

在Sphinx中向表中添加一个类?

我在rst中有一个表,我想在使用Sphinx编译为HTML时为其添加一个类.根据文档,.. class::在表之前添加一个指令应该将类添加到表中,而是添加一个定义列表.

表格代码是:

.. class:: special

== == ==
a  b  c
1  2  3
== == ==
Run Code Online (Sandbox Code Playgroud)

这导致:

<dl class="class">
<dt id="special">
<em class="property">class </em><code class="descname">special</code><a class="headerlink" href="#special" title="Permalink to this definition">¶</a></dt>
<dd></dd></dl>

<table border="1" class="docutils">
<colgroup>
<col width="33%" />
<col width="33%" />
<col width="33%" />
</colgroup>
<tbody valign="top">
<tr class="row-odd"><td>a</td>
<td>b</td>
<td>c</td>
</tr>
<tr class="row-even"><td>1</td>
<td>2</td>
<td>3</td>
</tr>
</tbody>
</table>
Run Code Online (Sandbox Code Playgroud)

我究竟做错了什么?我正在使用Sphinx 1.3.1

restructuredtext python-sphinx

7
推荐指数
2
解决办法
2729
查看次数

使用grid和ggplot2使用R创建连接图

我想知道如何修复一块地块.绘图以数组排列,以便一行中的所有绘图具有相同的Y轴变量,并且列中的所有绘图具有相同的X轴变量.

当在网格中连接在一起时,这将创建一个多重绘图.我禁用大多数图表上的标签,除了外部标签,因为内部标签具有相同的变量和比例.但是,由于外部图表具有标签和轴值,因此它们会产生与其他图案不同的大小.

我想在网格中添加2个列和行,用于变量名称和轴范围值...然后仅绘制相应网格空间上的变量名称和另一个网格空间上的轴值,因此仅绘制在剩余空间中指向并获得相同的大小.

编辑1:感谢rcs指点我 align.plot

编辑align.plot接受空值(当不需要轴中的标题/文本时)

现在我更接近目标了,但由于标签的缘故,第一个columun图的宽度仍然比其余的小.

示例代码:

grid_test <- function ()
{
    dsmall <- diamonds[sample(nrow(diamonds), 100), ] 

    #-----/align function-----
    align.plots <- function(gl, ...){
       # Obtained from http://groups.google.com/group/ggplot2/browse_thread/thread/1b859d6b4b441c90
       # Adopted from http://ggextra.googlecode.com/svn/trunk/R/align.r

       # BUGBUG: Does not align horizontally when one has a title.
       #    There seems to be a spacer used when a title is present.  Include the
       #    size of the spacer.  Not sure how to do this yet.

       stats.row <- vector( "list", gl$nrow )
       stats.col <- vector( "list", …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

6
推荐指数
1
解决办法
3251
查看次数

自编码QR条码?

我想知道是否有可能以某种文件格式创建QR,比如png,然后在QR中对png进行编码,这样得到的QR与你开始的相同?

recursion qr-code image infinite-loop

6
推荐指数
2
解决办法
1018
查看次数

Sphinx-doc TOC未使用RTD主题进行更新

我有一个以编程方式生成的sphinx-doc源,它使用了Read-The-Docs主题.源树看起来像:

source
??? conf.py
??? index.rst
??? models
?   ??? 1lin
?   ?   ??? 1lin_Amplero.rst
?   ?   ??? 1lin_Blodgett.rst
?   ?   ??? 1lin_Bugac.rst
?   ?   ??? ..
?   ?   ??? figures
?   ?   ?   ??? 1lin_all_PLUMBER_plot_all_metrics.png
?   ?   ?   ??? 1lin_all_PLUMBER_plot_distribution_metrics.png
?   ?   ?   ??? 1lin_all_PLUMBER_plot_standard_metrics.png
?   ?   ?   ??? Amplero
?   ?   ?   ?   ??? 1lin_Amplero_PLUMBER_plot_all_metrics.png
?   ?   ?   ?   ??? 1lin_Amplero_rank_counts_all_metrics.png
?   ?   ?   ..  .. 
?   ?   ??? index.rst
?   ?   .. 
?   ??? 2lin
?   ? …
Run Code Online (Sandbox Code Playgroud)

makefile python-sphinx autodoc read-the-docs

6
推荐指数
1
解决办法
375
查看次数

获取for循环列表的名称

在PHP中,您可以使用for循环访问数组的名称和值

foreach ( $array as $key => $value ) {
Run Code Online (Sandbox Code Playgroud)

在循环命名列表时,R中是否有可比的东西?

r list flow-control

5
推荐指数
2
解决办法
9024
查看次数

大熊猫情节用不同的变量为子图和颜色?

目前这段代码:

count_df = (df[['rank', 'name', 'variable', 'value']]
    .groupby(['rank', 'variable', 'name'])
    .agg('count')
    .unstack())
count_df .head()
#               value                          
# name           1lin STH_km27_lin ST_lin S_lin
# rank variable                                
# 1.0  NEE         24          115     33    28
#      Qg          23           54     14     9
#      Qh          37          124     11    28
# ...
count_df.plot(kind='bar')
Run Code Online (Sandbox Code Playgroud)

给我这个情节:

条形图上有太多的东西

subplots=True.plot()通话中使用让我这样:

无用的子图

这是非常没用的,因为颜色映射到与子图表面相同的变量.有没有办法选择哪个列/索引用于子绘图,这样我仍然可以有每个name(count_df列标题)的颜色,但variable每个子图,以便每个子图有一个条,每个name/rank分组rank,和是的name

python plot matplotlib pandas

5
推荐指数
1
解决办法
448
查看次数