小编Tal*_*ili的帖子

我怎样才能学会创建漂亮的信息图表(与我的R知识有关)?

我是一个忠实的R(r-project.org)用户,并且喜欢信息图表.

我刚看到这篇文章:http: //www.noupe.com/design/fantastic-information-architecture-resources.html

为信息设计人员提供一长串资源.

它让我想要做更美丽(不仅仅是提供信息)的R情节.

您对如何实现这一飞跃有任何建议/资源吗?

我需要拥有/开发哪些书籍/软件/技能才能制作精美的信息图表?

visualization r data-visualization

36
推荐指数
3
解决办法
1万
查看次数

将RIT与R一起使用可能存在的缺点?

我最近发现可以使用编译器包使用JIT(及时)使用R编译(我在最近的博客文章中总结了我对此主题的发现).

我被问到的一个问题是:

有任何陷阱吗?这听起来好得令人难以置信,只需输入一行代码即可.

环顾四周后,我发现一个可能的问题与JIT的"启动"时间有关.但是在使用JIT时还有其他问题需要注意吗?

我想与R的环境架构有一些限制,但我想不出一个简单的问题,我的头脑问题,任何建议或危险信号将有很大的帮助?

compiler-construction performance jit r

36
推荐指数
2
解决办法
3872
查看次数

如何将给定文件夹中的所有文件(格式不同)转换为不同的文件类型

我有一个包含许多不同类型图像的文件夹(png,jpg,jpeg,bmp,pdf),我想使用imagemagick将它们全部转换为png(例如).

是否有一个命令可以执行此操作?如果没有,我该怎么办呢?

谢谢.

imagemagick imagemagick-convert

30
推荐指数
3
解决办法
3万
查看次数

你如何改变R中的图书馆位置?

由于新的R 2.11版本,我想在这里实现Dirk的建议.

所以我要问 - 我怎样(永久)改变R的库路径?(最好的解决方案是可以在R内运行的解决方案)

installation r

29
推荐指数
3
解决办法
12万
查看次数

解压缩tar.gz文件?

我想tar.gz在R中下载并打开以下文件:

http://s.wordpress.org/resources/survey/wp2011-survey.tar.gz

有没有可以实现这一目标的命令?

r unzip

28
推荐指数
1
解决办法
3万
查看次数

将绘图保存为tiff,具有高分辨率用于发布(在R中)

我们发送文章的期刊要求如下:

为了确保您的数字的最佳复制质量,我们将欣赏高分辨率文件.所有数字最好应采用TIFF或EPS格式......并且应具有以下分辨率:
图形:800 - 1200 DPI
照片:400 - 800 DPI
颜色(仅CMYK):300 - 400 DPI(DPI =每英寸点数)

由于我发送图表,我试图使用tiff保存它.

这是我正在使用的代码:

tiff(filename = "c:\\aaa.tiff", 
     res = 800, pointsize = 2)
plot(1:100)
dev.off()    
Run Code Online (Sandbox Code Playgroud)

但遗憾的是,它会产生一个非常"笨重"的图像 - 如果我不在哪里使用pointsize = 2,我会得到错误信息:

plot.new()出错:数字边距太大

有什么建议?

tiff r

26
推荐指数
3
解决办法
5万
查看次数

如何将"版本控制"与R的"工作流程"结合起来?

我记得R用户写过他们使用"版本控制"(例如:"源代码控制"),我很想知道:你如何将"版本控制"与统计分析工作流程结合起来?

两个(非常)有趣的讨论谈论如何处理工作流程.但它们都没有引用修订控制元素:

对问题的长期更新:根据一些人的答案,以及评论中的Dirk的问题,我想更多地指出我的问题.

在阅读了关于" 版本控制 " 的Wiki文章(我以前不熟悉)之后,我很清楚,在使用版本控制时,我们所做的就是构建他的代码的开发结构.这种结构要么导致"最终产品",要么导致几个分支.

当建立类似的东西时,比方说,一个网站.通常有一种最终产品(网站),一路上有一些原型.

但在进行统计分析时,工作(我认为)是不同的.有时你知道你想去哪里.但更多时候,你会探索.探索清理数据集.探索不同的统计分析方法,并询问您的数据的各种问题(我正在写这篇文章,了解Frank Harrell和其他经验统计学家对数据挖掘的看法).

这就是为什么统计编程的工作流程问题(在我看来)是一个严肃而深刻的问题,引发了许多问题,更简单的问题是技术问题:

  • 您使用哪种版本控制软件(及其原因)?
  • 你使用哪个IDE(以及为什么)?更有趣的问题是关于工作流程:
  • 你如何构建你的文件?
  • 你作为一个单独的文件和什么作为修订保留?或以不同的方式询问 - 什么应该是"分支",什么应该是你的代码中的"子项目"?例如:在开始探索数据时,是否应该创建一个绘图然后删除,因为它不会导致任何位置(但保留为修订版)或者是否应该存在该路径的备份文件?

如何解决这种紧张是我最初的好奇.第二个问题是"我可能会缺少什么?".应该遵循哪些(经验)规则,以避免使用版本控制进行统计编程时常见的陷阱?

在我的直觉中,我觉得统计编程本质上与软件开发不同(我写的不是统计编程的真正专家,在软件开发中更是如此).这是我不确定我在这里阅读的关于版本控制的哪些课程将适用的方式.

非常感谢,Tal

statistics version-control workflow r

23
推荐指数
3
解决办法
5194
查看次数

什么是R中不同颜色的"好"调色板?(或者:将绿色和岩浆结合在一起吗?)

我有兴趣拥有一个"好"的发散颜色调色板.显然可以使用红色,白色和蓝色:

img <- function(obj, nam) {
  image(1:length(obj), 1, as.matrix(1:length(obj)), col=obj, 
        main = nam, ylab = "", xaxt = "n", yaxt = "n",  bty = "n")
}
rwb <- colorRampPalette(colors = c("red", "white", "blue"))
img(rwb(100), "red-white-blue")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

自从我最近爱上了绿色调色板以来,我希望将绿色和岩浆结合起来形成这种不同的颜色(当然,色盲的人只能看到颜色的绝对值,但有时候还可以).

当我尝试将绿色和岩浆结合起来时,我发现它们并没有在同一个地方"结束"(或"开始"),所以我得到这样的东西(我正在使用R,但这可能是相同的python用户):

library(viridis)
img(c(rev(viridis(100, begin = 0)), magma(100, begin = 0)), "magma-viridis")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

我们可以看到,当接近零时,绿色是紫色的,而岩浆是黑色的.我希望他们两个(或多或少)开始在同一个地方,所以我尝试使用0.3作为起点:

img(c(rev(viridis(100, begin = 0.3)), magma(100, begin = 0.3)), "-viridis-magma(0.3)")
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

这确实更好,但我想知道是否有更好的解决方案.

(我也在"标记"python用户,因为viridis最初来自matplotlib,所以使用它的人可能知道这样的解决方案)

谢谢!

python r colors matplotlib viridis

23
推荐指数
4
解决办法
7216
查看次数

你如何比较两个树形图之间的"相似性"(在R中)?

我有两个树形图,我希望相互比较,以找出它们是如何"相似".但我不知道有任何方法可以这样做(更不用说实现它的代码了,比方说,在R中).

任何线索?

更新(2014-09-13):

自从提出这个问题以来,我编写了一个名为dendextend的R包,用于树形图的可视化,操作和比较.此软件包在CRAN上,附带详细的插图.它包括诸如cor_cophenetic,cor_bakers_gammaBk/ Bk_plot.以及tanglegram用于在视觉上比较两棵树的功能.

statistics tree r dendrogram dendextend

21
推荐指数
2
解决办法
1万
查看次数

在Windows上使用sendmailR

我正在尝试使用以下代码在Windows上运行sendmailR:

## Not run: 
from <- "<tal.galili@gmail.com>" # sprintf("<sendmailR@\\%s>", Sys.info()[4])
to <- "<tal.galili@gmail.com>"
subject <- "Hello from R"
body <- list("It works!", mime_part(iris))
sendmail(from, to, subject, body,
         control=list(smtpServer="ASPMX.L.GOOGLE.COM."))
Run Code Online (Sandbox Code Playgroud)

并得到以下错误:

Error in socketConnection(host = server, port = port, blocking = TRUE) : 
  cannot open the connection
In addition: Warning message:
In socketConnection(host = server, port = port, blocking = TRUE) :
  smtp.gmail.com tal.galili@gmail.com:statisfun:25 cannot be opened
Run Code Online (Sandbox Code Playgroud)

这里的答案为Linux提供了解决方案,我将非常感谢Windows用户的建议.

谢谢.

email gmail smtp r sendmailr

20
推荐指数
2
解决办法
1万
查看次数