小编sha*_*dow的帖子

从数据框创建摘要统计表

我有以下5个变量的29个观测数据框(df):

    age   height_seca1 height_chad1 height_DL weight_alog1
1   19         1800         1797       180           70
2   19         1682         1670       167           69
3   21         1765         1765       178           80
4   21         1829         1833       181           74
5   21         1706         1705       170          103
6   18         1607         1606       160           76
7   19         1578         1576       156           50
8   19         1577         1575       156           61
9   21         1666         1665       166           52
10  17         1710         1716       172           65
11  28         1616         1619       161           66
12  22         1648         1644       165           58
13  19 …
Run Code Online (Sandbox Code Playgroud)

r dataframe

18
推荐指数
3
解决办法
6万
查看次数

R中的掩蔽方法

这个问题,特别是这个答案提出了以下问题:如何得到关于R中方法掩码的警告?

如果在干净的R会话中运行以下代码,您会注意到加载dplyr更改了默认方法lag.

lag(1:3, 1)
## [1] 1 2 3
## attr(,"tsp")
## [1] 0 2 1
require(dplyr)
lag(1:3, 1)
## [1] NA  1  2
Run Code Online (Sandbox Code Playgroud)

如果附加了包dplyr,则会获得几个被屏蔽对象的警告,但是没有关于lag被屏蔽的默认方法的警告.原因是在调用时,调用包中lag的泛型函数stats.

lag
## function (x, ...) 
## UseMethod("lag")
## <bytecode: 0x000000000c072188>
## <environment: namespace:stats>
Run Code Online (Sandbox Code Playgroud)

methods(lag)告诉我有一种方法lag.default.我可以看到有两种方法使用getAnywhere:

getAnywhere(lag.default)
## 2 differing objects matching ‘lag.default’ were found
## in the following places
## registered S3 method for lag …
Run Code Online (Sandbox Code Playgroud)

r dplyr r-package

17
推荐指数
2
解决办法
1388
查看次数

Java Apache POI Excel另存为PDF

如何将excel文件转换/保存到pdf?我正在使用java play framework生成一些excel文件,现在需求变为pdf.我不想重新编码.

有没有办法转换成pdf

excel我正在生成的文件来自模板; 我读了excel模板文件,写了更改,并保存为新的excel文件.这样,模板就不会改变.它包含边框,图像和其他格式.

java pdf excel apache-poi playframework-2.0

15
推荐指数
2
解决办法
5万
查看次数

R闪亮的颜色数据帧

我有一个数据框:

   runApp(
      list(ui = bootstrapPage(pageWithSidebar(
        headerPanel("Data frame with colors"),
        sidebarPanel(),
        mainPanel(
           tableOutput("my_dataframe")
        ) 
      )
     )
   ,
    server = function(input, output) {
       output$my_dataframe <- renderTable({ 
               data.frame("Brand ID"=1:4,"Client1"=c("red", "green", "green", "green"),
                                         "Client2"=c("green", "red", "green", "red")) 
       }) 
    }
)
)
Run Code Online (Sandbox Code Playgroud)

是否可以为数据框着色,如:

在此输入图像描述

例如,当我有contidion1时,我需要在条件2上用红色为数据帧单元着色 - 用绿色.

任何帮助将非常感激.

r colors dataframe shiny

13
推荐指数
1
解决办法
4819
查看次数

在R中的数据框中组合两个列表

我有两个不同结构的列表:

listA <- list(c("a","b","c"), c("d","e"))
listB <- list(0.05, 0.5)

listA
[[1]]
[1] "a" "b" "c"

[[2]]
[1] "d" "e"

listB
[[1]]
[1] 0.05

[[2]]
[1] 0.5
Run Code Online (Sandbox Code Playgroud)

我知道如何使用循环将两个列表组合在一个看起来像下面的数据框中,但我确信有一种更有效的方法.

data.frame(A = c("a","b","c","d","e"), B = c(rep(0.05,3), rep(0.5,2)))
  A    B
1 a 0.05
2 b 0.05
3 c 0.05
4 d 0.50
5 e 0.50
Run Code Online (Sandbox Code Playgroud)

merge r list dataframe

12
推荐指数
2
解决办法
3万
查看次数

加速R中大数据帧的处理

上下文

我一直在尝试实现本文最近提出的算法.给定大量的文本(语料库)的,该算法应该返回特性Ñ -grams(即,序列Ñ语料库的话).用户可以决定适当的n,并且在我尝试使用n = 2-6时,就像在原始论文中一样.换句话说,使用该算法,我想提取表征语料库的2到6克.

我能够实现基于哪个特征n -gram被识别来计算得分的部分,但是一直在努力消除非特征性的.

数据

我有一个名为的列表token.df,其中包含五个数据框,包括出现在语料库中的所有n- gram.每个数据帧对应于n- gram中的每个n.例如,按字母顺序包括所有bigrams(2-gram)及其分数(下面称为mi).token.df[[2]]

> head(token.df[[2]])
w1    w2      mi
_      eos  17.219346
_   global   7.141789
_     what   8.590394
0        0   2.076421
0       00   5.732846
0      000   3.426785
Run Code Online (Sandbox Code Playgroud)

在这里,二元组0 0(虽然它们不是这样的单词)的得分为2.076421.由于数据框包括出现在语料库中的所有n- gram,因此它们每行都有超过一百万行.

> sapply(token.df, nrow)
[[1]]
NULL

[[2]]
[1] 1006059  # number of unique bigrams in the corpus

[[3]]
[1] 2684027  # number of unique trigrams …
Run Code Online (Sandbox Code Playgroud)

r corpus dataframe

10
推荐指数
1
解决办法
643
查看次数

R:stat_smooth组(x轴)

我有一个数据库,想要使用stat_smooth显示一个数字.

我可以显示avg_time vs Scored_Probabilities数字,如下所示:

c <- ggplot(dataset1, aes(x=Avg.time, y=Scored.Probabilities))
c + stat_smooth()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

但是当将Avg.time更改为时间或Age时,会发生错误:

c <- ggplot(dataset1, aes(x=Age, y=Scored.Probabilities))
c + stat_smooth()
error: geom_smooth: Only one unique x value each group. Maybe you want aes(group = 1)?
Run Code Online (Sandbox Code Playgroud)

我该怎么办呢?

r smooth stat ggplot2

8
推荐指数
1
解决办法
6937
查看次数

rbindlist表示缺少级别的因素

data.tables想要几个rbindlist.这些表包含具有(可能缺失)级别的因素.然后rbindlist(...)表现不同于do.call(rbind(...)):

dt1 <- data.table(x=factor(c("a", "b"), levels=letters))

rbindlist(list(dt1, dt1))[,x] 
## [1] a b a b
## Levels: a b

do.call(rbind, list(dt1, dt1))[,x]
## [1] a b a b
## Levels: a b c d e f g h i j k l m n o p q r s t u v w x y z
Run Code Online (Sandbox Code Playgroud)

如果我想保持水平,我rbind是否有data.table办法或有办法吗?

r data.table

6
推荐指数
1
解决办法
287
查看次数

在r-devel版本下构建的R包?

我正在加载AIMS包并收到警告:

package ‘AIMS’ was built under R version 3.2.0
Run Code Online (Sandbox Code Playgroud)

我以为R-3.1.2 ("Pumpkin Helmet")是最新版本所以我检查了 CRAN并且看不到任何关于a的内容R-3.2.0.

在称之为拼写错误之前,我使用不同的关键字搜索了"问题",并在此页面上从r-project网站上提到了两个R版本运行,a R-release(R-3.1.2)和" R-devel,to be R-3.2.0".
谷歌搜索"r_devel"证实了我的猜测,这是当前的开发版本.

我有点惊讶于可以在开发版本下构建软件包,我有一个双重问题:
- 如何在"待发布" R版本下构建软件包,它是否"安全"?
- 鉴于开发版本尚未发布,我如何使用R其构建版本的软件包?(拥有以前的R版本并不妨碍我使用该软件包,但我不确定我对此警告感到满意......)

或许它真的只是一个错字?...

release r version cran r-package

6
推荐指数
0
解决办法
802
查看次数

从日期列创建假期的指示变量

如果这是一个简单的问题,我仍然是一个傻瓜新手,请原谅我,但我无法在stackoverflow上找到答案.我想为每个主要的美国假期创建一组指标变量,只需将一个函数应用到我的日期字段,该函数可以检测哪些天是假日,然后我可以将Model.matrix等转换为一组指标变量.
例如,我有从2012年1月1日到2013年9月15日的每日数据,我想为复活节创建一个变量指标.

我目前正在使用该timeDate软件包将一年时间用于其功能Easter()以查找日期.然后,我将日期键入以下代码以创建指示符变量.

Easter(2012)
EasterInd2012<-as.numeric(DATASET$Date=="2012-04-08")
Run Code Online (Sandbox Code Playgroud)

variables r dataframe

5
推荐指数
1
解决办法
2495
查看次数