我现在已经在互联网上搜索了一个小时没能成功,在我的生活中,我找不到splinefun使用时method='fmm'(如Forsythe,Malcolm和Moler的方法)样条曲线如何完全适合一组点的解释.我知道以下内容:
拟合具有N个节点的三次样条是(N-1)*4个未知数的问题.通过假设样条在结处是平滑的(精确地说:它的一阶和二阶导数是连续的),假设样条经过所有结和(N-2)*2条件,得到(N-1)*2个等式.这留下了两个条件来确定样条曲线.通过假设二阶导数在端点处为零来找到自然立方.但fmm确实有所不同.据我所知,它适合一个精确的立方体到一个结的子集(这个结?)然后在样条上强加这个立方的某些导数(这些导数在哪里评估?).
我有一个线性回归模型的结果,在R中有一个因子变量,我想要很好然后输出到LaTeX.理想情况下,因子变量将通过一个行显示在表中,该行给出变量的名称和参考类别,否则为空白,然后下面带有缩进文本的行给出因子的级别以及相应的估计值.
我一直用这个stargazer包把R的回归结果变成了LaTeX,但是看不到用它来实现我想要的结果.一个例子:
library(ggplot2)
library(stargazer)
levels(diamonds$cut)
options(contrasts = c("contr.treatment", "contr.treatment"))
model1 <- lm(price~cut,data=diamonds)
stargazer(model1,type='text')
Run Code Online (Sandbox Code Playgroud)
这会产生默认输出:
===============================================
Dependent variable:
---------------------------
price
-----------------------------------------------
cutGood -429.893***
(113.849)
cutVery Good -376.998***
(105.164)
cutPremium 225.500**
(104.395)
cutIdeal -901.216***
(102.412)
Constant 4,358.758***
(98.788)
-----------------------------------------------
Observations 53,940
R2 0.013
Adjusted R2 0.013
Residual Std. Error 3,963.847 (df = 53935)
F Statistic 175.689*** (df = 4; 53935)
===============================================
Note: *p<0.1; **p<0.05; ***p<0.01
Run Code Online (Sandbox Code Playgroud)
这就是我想要的:
===============================================
Dependent variable:
---------------------------
price
-----------------------------------------------
Cut (Reference: Fair)
Good -429.893***
(113.849)
Very Good …Run Code Online (Sandbox Code Playgroud) 我有一个分组数据框,如下所示:
df <- data.frame(group = rep(1:4, each=3),
lets = rep(LETTERS[1:4], times=3))
Run Code Online (Sandbox Code Playgroud)
对于每一行,我现在想要识别lets除lets行本身之外的同一组中的所有行.使用dplyr我可以得到所有 lets:
df %>%
group_by(group) %>%
mutate(all_lets_in_group = paste(lets, collapse=','))
Run Code Online (Sandbox Code Playgroud)
但是,如何从我输入的内容中排除lets当前行paste()?
我有一堆字符串,其中一些相当长,如下:
movie.titles <- c("Il divo: La spettacolare vita di Giulio Andreotti","Defiance","Coco Before Chanel","Happy-Go-Lucky","Up","The Imaginarium of Doctor Parnassus")
Run Code Online (Sandbox Code Playgroud)
我现在想要将这些字符串截断为最多30个字符,但是这样的方式是在过程中不会分割任何单词,理想情况下如果字符串被截断,则将字符串添加到字符串的末尾.
我有一堆字符串,包含姓氏,名字格式的名字列表,用逗号分隔,如下所示:
names <- c('Beaufoy, Simon, Boyle, Danny','Nolan, Christopher','Blumberg, Stuart, Cholodenko, Lisa','Seidler, David','Sorkin, Aaron')
Run Code Online (Sandbox Code Playgroud)
将字符串中的所有这些名称转换为名字姓氏格式的最简单方法是什么?
我的 Google Analytics(分析)数据分布在多个 BigQuery 数据集中,所有数据集都使用相同的架构。我想使用 BigQuery 的新标准 SQL 方言同时查询这些数据集中的多个表。我知道我可以查询单个数据库中的多个表,如下所示:
FROM `12345678`.`ga_sessions_2016*` s
WHERE s._TABLE_SUFFIX BETWEEN '0501' AND '0720'
Run Code Online (Sandbox Code Playgroud)
我不明白的是如何不仅查询12345678而且23456789同时查询。
我有一个knitr文档,其中包含一个回归结果表作为输出stargazer,如下所示:
\documentclass[11pt]{article}
\begin{document}
<<setup, echo = FALSE, results= 'hide', message = FALSE>>=
data(mtcars)
library(stargazer)
@
Lorem ipsum dolor sit amet, consectetur adipiscing elit. Nullam eleifend molestie nisi, id scelerisque orci venenatis imperdiet. Fusce dictum congue faucibus. Phasellus mollis bibendum tellus eu interdum. Nam sollicitudin congue fringilla. Donec rhoncus viverra lorem vel molestie. Ut varius facilisis ante, a pretium arcu feugiat in. Maecenas sagittis accumsan massa. Pellentesque sollicitudin odio non odio elementum vel tristique dui mattis. Pellentesque …Run Code Online (Sandbox Code Playgroud) 有没有办法教RStudio处理.Rtex扩展名为knitr/Sweave文件的文件(比如.Rnw文件)?
我正在尝试在闪亮的应用程序环境中使用按图点击事件。在正式演示之后,我将使用以下代码来更新日期选择器,并在单击时跳转到我的应用程序中的另一个选项卡:
observe({
d <- event_data("plotly_click", source = 'plot')
if(!is.null(d) & (input$navPanel == 'overview')) {
d %>% filter(curveNumber == 0) %>% select(x) -> selected_date
updateDateInput(session, "date", value = lubridate::ymd(selected_date$x))
updateTabsetPanel(session, "navPanel", selected = "details")
}
Run Code Online (Sandbox Code Playgroud)
然而,当我再尝试从切换details到overview标签,我立即得到后仰的details标签。我猜想,这是因为该事件不会被清零,即d是不是null当标签被改变,因此在条件if-clause评估为TRUE。
因此,如何以编程方式清除click事件?添加d <- NULL到条件的末尾似乎没有做到这一点。
我在不同的s 和不同的s 中观察users ,并且可能会多次看到它们,如下所示:timesituation
df <- data.table(time = c(1,1,1,2,2),
user = c(1,1,2,1,2),
situation = c(1,1,1,2,2),
observation = c(1,2,1,1,1))
Run Code Online (Sandbox Code Playgroud)
我想做的是使用 来计算每个时间段内user-s的数量。预期输出:situationdata.table
result <- data.table(time = c(1,2),
user_situations = c(2,2))
Run Code Online (Sandbox Code Playgroud)
我知道我可以以连锁方式做到这一点:
unique(df[, .(time, user, situation)])[, .(user_situations = .N), .(time)]
Run Code Online (Sandbox Code Playgroud)
但想知道是否有一种简单的方法可以一次性完成此操作。