我有以下5个变量的29个观测数据框(df):
age height_seca1 height_chad1 height_DL weight_alog1
1 19 1800 1797 180 70
2 19 1682 1670 167 69
3 21 1765 1765 178 80
4 21 1829 1833 181 74
5 21 1706 1705 170 103
6 18 1607 1606 160 76
7 19 1578 1576 156 50
8 19 1577 1575 156 61
9 21 1666 1665 166 52
10 17 1710 1716 172 65
11 28 1616 1619 161 66
12 22 1648 1644 165 58
13 19 …Run Code Online (Sandbox Code Playgroud) 这个问题,特别是这个答案提出了以下问题:如何得到关于R中方法掩码的警告?
如果在干净的R会话中运行以下代码,您会注意到加载dplyr更改了默认方法lag.
lag(1:3, 1)
## [1] 1 2 3
## attr(,"tsp")
## [1] 0 2 1
require(dplyr)
lag(1:3, 1)
## [1] NA 1 2
Run Code Online (Sandbox Code Playgroud)
如果附加了包dplyr,则会获得几个被屏蔽对象的警告,但是没有关于lag被屏蔽的默认方法的警告.原因是在调用时,调用包中lag的泛型函数stats.
lag
## function (x, ...)
## UseMethod("lag")
## <bytecode: 0x000000000c072188>
## <environment: namespace:stats>
Run Code Online (Sandbox Code Playgroud)
并methods(lag)告诉我有一种方法lag.default.我可以看到有两种方法使用getAnywhere:
getAnywhere(lag.default)
## 2 differing objects matching ‘lag.default’ were found
## in the following places
## registered S3 method for lag …Run Code Online (Sandbox Code Playgroud) 如何将excel文件转换/保存到pdf?我正在使用java play framework生成一些excel文件,现在需求变为pdf.我不想重新编码.
有没有办法转换成pdf?
excel我正在生成的文件来自模板; 我读了excel模板文件,写了更改,并保存为新的excel文件.这样,模板就不会改变.它包含边框,图像和其他格式.
我有一个数据框:
runApp(
list(ui = bootstrapPage(pageWithSidebar(
headerPanel("Data frame with colors"),
sidebarPanel(),
mainPanel(
tableOutput("my_dataframe")
)
)
)
,
server = function(input, output) {
output$my_dataframe <- renderTable({
data.frame("Brand ID"=1:4,"Client1"=c("red", "green", "green", "green"),
"Client2"=c("green", "red", "green", "red"))
})
}
)
)
Run Code Online (Sandbox Code Playgroud)
是否可以为数据框着色,如:

例如,当我有contidion1时,我需要在条件2上用红色为数据帧单元着色 - 用绿色.
任何帮助将非常感激.
我有两个不同结构的列表:
listA <- list(c("a","b","c"), c("d","e"))
listB <- list(0.05, 0.5)
listA
[[1]]
[1] "a" "b" "c"
[[2]]
[1] "d" "e"
listB
[[1]]
[1] 0.05
[[2]]
[1] 0.5
Run Code Online (Sandbox Code Playgroud)
我知道如何使用循环将两个列表组合在一个看起来像下面的数据框中,但我确信有一种更有效的方法.
data.frame(A = c("a","b","c","d","e"), B = c(rep(0.05,3), rep(0.5,2)))
A B
1 a 0.05
2 b 0.05
3 c 0.05
4 d 0.50
5 e 0.50
Run Code Online (Sandbox Code Playgroud) 我一直在尝试实现本文最近提出的算法.给定大量的文本(语料库)的,该算法应该返回特性Ñ -grams(即,序列Ñ语料库的话).用户可以决定适当的n,并且在我尝试使用n = 2-6时,就像在原始论文中一样.换句话说,使用该算法,我想提取表征语料库的2到6克.
我能够实现基于哪个特征n -gram被识别来计算得分的部分,但是一直在努力消除非特征性的.
我有一个名为的列表token.df,其中包含五个数据框,包括出现在语料库中的所有n- gram.每个数据帧对应于n- gram中的每个n.例如,按字母顺序包括所有bigrams(2-gram)及其分数(下面称为mi).token.df[[2]]
> head(token.df[[2]])
w1 w2 mi
_ eos 17.219346
_ global 7.141789
_ what 8.590394
0 0 2.076421
0 00 5.732846
0 000 3.426785
Run Code Online (Sandbox Code Playgroud)
在这里,二元组0 0(虽然它们不是这样的单词)的得分为2.076421.由于数据框包括出现在语料库中的所有n- gram,因此它们每行都有超过一百万行.
> sapply(token.df, nrow)
[[1]]
NULL
[[2]]
[1] 1006059 # number of unique bigrams in the corpus
[[3]]
[1] 2684027 # number of unique trigrams …Run Code Online (Sandbox Code Playgroud) 我有一个数据库,想要使用stat_smooth显示一个数字.
我可以显示avg_time vs Scored_Probabilities数字,如下所示:
c <- ggplot(dataset1, aes(x=Avg.time, y=Scored.Probabilities))
c + stat_smooth()
Run Code Online (Sandbox Code Playgroud)

但是当将Avg.time更改为时间或Age时,会发生错误:
c <- ggplot(dataset1, aes(x=Age, y=Scored.Probabilities))
c + stat_smooth()
error: geom_smooth: Only one unique x value each group. Maybe you want aes(group = 1)?
Run Code Online (Sandbox Code Playgroud)
我该怎么办呢?
我data.tables想要几个rbindlist.这些表包含具有(可能缺失)级别的因素.然后rbindlist(...)表现不同于do.call(rbind(...)):
dt1 <- data.table(x=factor(c("a", "b"), levels=letters))
rbindlist(list(dt1, dt1))[,x]
## [1] a b a b
## Levels: a b
do.call(rbind, list(dt1, dt1))[,x]
## [1] a b a b
## Levels: a b c d e f g h i j k l m n o p q r s t u v w x y z
Run Code Online (Sandbox Code Playgroud)
如果我想保持水平,我rbind是否有data.table办法或有办法吗?
我正在加载AIMS包并收到警告:
package ‘AIMS’ was built under R version 3.2.0
Run Code Online (Sandbox Code Playgroud)
我以为R-3.1.2 ("Pumpkin Helmet")是最新版本所以我检查了 CRAN并且看不到任何关于a的内容R-3.2.0.
在称之为拼写错误之前,我使用不同的关键字搜索了"问题",并在此页面上从r-project网站上提到了两个R版本运行,a R-release(R-3.1.2)和" R-devel,to be R-3.2.0".
谷歌搜索"r_devel"证实了我的猜测,这是当前的开发版本.
我有点惊讶于可以在开发版本下构建软件包,我有一个双重问题:
- 如何在"待发布" R版本下构建软件包,它是否"安全"?
- 鉴于开发版本尚未发布,我如何使用R其构建版本的软件包?(拥有以前的R版本并不妨碍我使用该软件包,但我不确定我对此警告感到满意......)
或许它真的只是一个错字?...
如果这是一个简单的问题,我仍然是一个傻瓜新手,请原谅我,但我无法在stackoverflow上找到答案.我想为每个主要的美国假期创建一组指标变量,只需将一个函数应用到我的日期字段,该函数可以检测哪些天是假日,然后我可以将Model.matrix等转换为一组指标变量.
例如,我有从2012年1月1日到2013年9月15日的每日数据,我想为复活节创建一个变量指标.
我目前正在使用该timeDate软件包将一年时间用于其功能Easter()以查找日期.然后,我将日期键入以下代码以创建指示符变量.
Easter(2012)
EasterInd2012<-as.numeric(DATASET$Date=="2012-04-08")
Run Code Online (Sandbox Code Playgroud)