小编Del*_*eet的帖子

是否可以在rMarkdown中使用可排序(交互式)表?

我使用kable()knitr包装上显示一个HTML文档中的表格.有可能使它可以排序吗?一些示例代码,

---
title: "Test"
output: html_document
---

```{r, echo=FALSE, comment=""}
kable(data.frame("a"=1:10,"b"=11:20),digits=2)
```
Run Code Online (Sandbox Code Playgroud)

r knitr r-markdown

20
推荐指数
1
解决办法
1万
查看次数

ggplot2直方图,密度曲线总和为1

绘制具有对于非标准化数据总和为1的密度曲线的直方图是非常困难的.关于此问题已有很多问题,但他们的解决方案都不适用于我的数据.需要有一个简单的解决方案.我找不到一个有效的简单解决方案的答案.

一些例子:

解决方案仅适用于标准化的正常数据 ggplot2:使用密度曲线叠加直方图

具有离散数据且无密度曲线 ggplot2密度直方图,宽度= .5,vline和居中条位置

没有答案 使用自定义分档使用ggplot2覆盖密度和直方图

在我的数据上,密度不总和为1 在ggplot2中创建密度直方图?

我的数据ggplot2密度直方图与自定义bin边缘不总和为1

这里用例子详细解释,但密度不是1,我的数据 "密度"曲线覆盖在直方图上,其中垂直轴是频率(即计数)或相对频率?

-

一些示例代码:

#Example code
set.seed(1)
t = data.frame(r = runif(100))

#first we try the obvious simple solution that should work
ggplot(t, aes(r)) + 
  geom_histogram() + 
  geom_density()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

所以,显然密度不等于1.

#maybe geom_histogram needs a ..density.. ?
ggplot(t, aes(r)) + 
  geom_histogram(aes(y = ..density..)) + 
  geom_density()
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

它确实改变了一些东西,但不正确.

#maybe geom_density needs a ..density.. too ?
ggplot(t, aes(r)) + 
  geom_histogram(aes(y = ..density..)) + 
  geom_density(aes(y = ..density..))
Run Code Online (Sandbox Code Playgroud)

那里没有变化.

#maybe binwidth …
Run Code Online (Sandbox Code Playgroud)

r histogram ggplot2

11
推荐指数
1
解决办法
6339
查看次数

使用<U + 0092> Unicode字符的字符串出现问题

我有一个非常大的数据集(70k行,2600列,CSV格式),我通过网络抓取创建.不幸的是,在某些时候进行预处理,处理等一些有问题的字符已经以奇怪的方式编码并且我在处理它们时遇到了问题.

我有如下字符串:

x = "but it doesn<U+0092>t matter"
Run Code Online (Sandbox Code Playgroud)

查找代码,我们可以看到它应该是实际应该是的字符'(数据是用户生成的,因此可能包含各种奇数字符).虽然从看这个角色,似乎人也有它(问题1,2,3).它被标记为一个控制角色,不知道那是什么,但也许这就是为什么它很难处理.

关于R中的Unicode的大多数其他问题都是以这样的格式关注Unicode \u0092.

只是用 Encoding()

我们试试吧:

#> x = "but it doesn<U+0092>t matter"
#> Encoding(x)
#[1] "unknown"
#> Encoding(x) = "UTF-8"
#> Encoding(x)
#[1] "unknown"
#> x
#[1] "but it doesn<U+0092>t matter"
Run Code Online (Sandbox Code Playgroud)

所以这似乎没有做任何事情.

使用以前这些问题中的hack函数

有一些先前的问题涉及这种Unicode格式并尝试转换它们:

奇怪的是,他们给出了工作的例子,但我的却没有.

#> test.string <- "This is a <U+03B1> <U+03B2> <U+03B2> <U+03B3> test <U+03B4> string."
#> Encoding(test.string)
#[1] "unknown"
#> to_true_unicode(test.string)
#[1] "This is …
Run Code Online (Sandbox Code Playgroud)

unicode encoding r

11
推荐指数
2
解决办法
4903
查看次数

如何处理离散轴上的ggplot2和重叠标签

ggplot2似乎没有内置的方法来处理散点图上的文本过度绘图.但是,我有一个不同的情况,标签是离散轴上的标签,我想知道这里有人有一个比我一直做的更好的解决方案.

一些示例代码:

library(ggplot2)

#some example data
test.data = data.frame(text = c("A full commitment's what I'm thinking of",
                                "History quickly crashing through your veins",
                                "And I take A deep breath and I get real high",
                                "And again, the Internet is not something that you just dump something on. It's not a big truck."),
                       mean = c(3.5, 3, 5, 4),
                       CI.lower = c(4, 3.5, 5.5, 4.5),
                       CI.upper = c(3, 2.5, 4.5, 3.5))

#plot
ggplot(test.data, aes_string(x = "text", y …
Run Code Online (Sandbox Code Playgroud)

plot r ggplot2 axis-labels

9
推荐指数
1
解决办法
4841
查看次数

与ggplot2的相关矩阵图

我想创建一个相关矩阵图,即一个图,其中每个变量都在一个散点图中绘制,而另一个变量则与pairs()or或splom().我想用ggplot2做这个.请看这里的例子.该链接提到了某人在ggplot2中编写的代码,但是,它已经过时且不再有效(即使在您更换了已弃用的部分之后).

人们可以通过循环中的循环然后进行此操作multiplot(),但必须有更好的方法.我尝试将数据集熔化为long,然后复制值和变量,然后使用facet.这几乎给你一些正确的东西.

d = data.frame(x1=rnorm(100),
               x2=rnorm(100),
               x3=rnorm(100),
               x4=rnorm(100),
               x5=rnorm(100))
library(reshape2)
d = melt(d)
d$value2 = d$value
d$variable2 = d$variable

library(ggplot2)
ggplot(data=d, aes(x=value, y=value2)) +
  geom_point() +
  facet_grid(variable ~ variable2)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

这使得一般结构正确,但仅适用于绘制每个变量对自己.是否有一些更聪明的方法来做到这一点,而不诉诸2循环?

r ggplot2 correlation

8
推荐指数
1
解决办法
8147
查看次数

模块化R降价结构

有一些问题已经存在,但它们要么不清楚,要么提供无效的解决方案,可能是因为它们已经过时了:

用于大型项目的模块化代码结构

R Markdown/Notebook很不错,但就其呈现方式而言,通常只有一个文件包含所有文本和所有代码块.我经常有一些项目,这样的单一文件结构不是一个好的设置.相反,我使用单个.R.R文件按顺序加载其他文件.我想使用R Notebook复制这个结构,即我有一个.Rmd文件,我从多个.R文件中调用代码.

以这种方式使用项目的好处是,它允许使用.R文件的RStudio进行良好的正常工作流程,但也可以使用R Notebook/Markdown的简洁输出而无需复制代码.

最小的例子

这被简化以使示例尽可能小.两个.R文件和一个主.Rmd文件.

start.R

# libs --------------------------------------------------------------------
library(pacman)
p_load(dplyr, ggplot2)
#normally load a lot of packages here

# data --------------------------------------------------------------------
d = iris
#use iris for example, but normally would load data from file

# data manipulation tasks -------------------------------------------------
#some code here to extract useful info from the data
setosa = dplyr::filter(d, Species == "setosa")
Run Code Online (Sandbox Code Playgroud)

plot.R …

r r-markdown rnotebook

7
推荐指数
1
解决办法
1266
查看次数

防止 PyCharm 在运行时打开浏览器/新标签页

我发现很多人希望 PyCharm 每次单击运行时都打开浏览器/新选项卡。

好吧,我run经常点击并且已经打开了我需要的标签。不得不关闭新的非常令人沮丧,我想将其关闭。我已经浏览了所有菜单,但找不到Run browser某些人谈论的设置。

我还尝试在“设置”->“工具”->“浏览器”中禁用对浏览器的所有 Django 支持,但这没有任何区别。

版本:

  • PyCharm 2017.1.1
  • 蟒蛇 3.5.x
  • Django 1.10

python browser django

6
推荐指数
1
解决办法
2867
查看次数

使用 R 包 rms 中的限制三次样条报告的系数

我试图理解rmsR 中包的一些输出,其中我在分位数回归中使用受限三次样条。我在理解输出时遇到的问题可能更多地与受限三次样条有关,而不是与我在分位数回归中使用它们的事实有关。我拟合一个k = 3 节的受限三次样条函数,如下所示:

fitted.model <- Rq(y ~ rcs(x, 3), x=TRUE, y=TRUE, tau=0.50, data=d)
Run Code Online (Sandbox Code Playgroud)

我很困惑的是

coef(fitted.model)

显示:

  Intercept        x       x' 

39.67901296  0.31760226  0.01875437 
Run Code Online (Sandbox Code Playgroud)

然而

Function(fitted.model)

显示:

function(x = 56.15) {39.679013+0.31760226* x+1.2554621e-05*pmax(x-38.45,0)^3-2.3161627e-05*pmax(x-56.15,0)^3+1.0607006e-05*pmax(x-77.1,0)^3 }
Run Code Online (Sandbox Code Playgroud)

给定RMS书中的公式2.24和2.25,我预计所获得的系数β 0、β 1和β 2(即β k-1coef(fitted.model) )将是用 所示的前三个(即k-1)系数Formula(fitted.model)。截距 (β 0 ) 和 X 的系数 (β 1 ) 显然相同,但公式中显示的 β 2与 中的第二个系数不同coef(fitted.model)。我误解了什么?

regression r

5
推荐指数
1
解决办法
2779
查看次数

django static admin 404 for icon_clock.gif和icon_calender.gif

我可以找到一个先前的问题:

使用Django和s3boto,一些管理员图像(icon_clock.gif&icon_calendar.gif)不显示

但它非常过时(2013年).我在Ubuntu 14.04.3 LTS上运行django 1.9.1,apache,wsgi.

首先问题是jquery文件丢失了,但是在修复的问题中运行collectstatic(manage.py)virtualenv.但是,仍然缺少两个管理媒体文件.404 URL调用是:

http://example.com/missing-admin-media-prefix/img/icon_calendar.gif
http://example.com/missing-admin-media-prefix/img/icon_clock.gif
Run Code Online (Sandbox Code Playgroud)

奇怪的URL前缀导致人们找到与该问题相关的几个非常古老的问题,但似乎已经为django 1.9.1折旧了.

settings.py看起来像这样:

STATIC_URL = '/static/'
#ADMIN_MEDIA_PREFIX = '/static/admin/'
#MEDIA_URL = "/media/"
#MEDIA_ROOT = "/home/user/app_root/media/"
STATIC_ROOT = "/home/user/app_root/static/"
Run Code Online (Sandbox Code Playgroud)

已经过时的线条是我在与同一问题相关的过时问题中找到的建议(没有工作).所有其他静态文件都可以正常工作,包括大多数管理文件.

我已经没想完了.

python django

5
推荐指数
1
解决办法
1266
查看次数

Django的脚本:找不到脚本'filename'的(有效)模块

我正在尝试使用Django-extension RunScript从Django shell运行脚本.我以前做过这个,但它拒绝承认我的新脚本:

(env) mint@mint-VirtualBox ~/GP/GP $ python manage.py runscript fill_in_random_variants
No (valid) module for script 'fill_in_random_variants' found
Try running with a higher verbosity level like: -v2 or -v3
Run Code Online (Sandbox Code Playgroud)

运行任何其他脚本时工作正常:

(env) mint@mint-VirtualBox ~/GP/GP $ python manage.py runscript fill_in_variants
Success! At least, there were no errors.
Run Code Online (Sandbox Code Playgroud)

我已经仔细检查过该文件是否存在,包括将其重命名为其他内容.我也尝试使用不存在的脚本名称运行命令:

(env) mint@mint-VirtualBox ~/GP/GP $ python manage.py runscript thisfiledoesntexist
No (valid) module for script 'thisfiledoesntexist' found
Try running with a higher verbosity level like: -v2 or -v3
Run Code Online (Sandbox Code Playgroud)

而且错误是一样的.

为什么RunScript找不到我的文件?

python django

5
推荐指数
2
解决办法
2477
查看次数