我正在尝试访问Wikipedia页面以获取页面列表,并收到以下错误:
library(RCurl)
u <- "http://en.wikipedia.org/w/index.php?title=Special%3APrefixIndex&prefix=tal&namespace=4"
getURL(u)
[1] "Scripts should use an informative User-Agent string with contact information, or they may be IP-blocked without notice.\n"
Run Code Online (Sandbox Code Playgroud)
我希望通过Wikipedia api访问该页面,但我不确定它是否会起作用.
事实上,其他页面的读取没有问题,例如:
u <- "http://en.wikipedia.org/wiki/Wikipedia:Talk"
getURL(u)
Run Code Online (Sandbox Code Playgroud)
有什么建议?
旁注:总的来说,我宁愿不刮维基页面并通过api,但我担心这些特定的页面还没有通过api ...
我希望使用R下载和分析我的某个Google文档的修订历史记录,找出有多少编辑对其进行的统计信息.
我看到已经有一些方法可以使用R访问谷歌文档.
有没有人事先知道(在我开始尝试破解我的方式之前),是否或如何(合理地容易)完成?
谢谢.
我想通过在R中运行命令在Windows 7机器上下载并安装pandoc.这可能吗?
(我知道我可以手动执行此操作,但是当我向学生展示时 - 我可以在R代码块中组织的步骤越多越好)
我正在使用NppToR作为扩展,允许使用notepad ++作为R的IDE.
但是我还没有看到实现的一些功能(我从另一个IDE解决方案编译列表,这不是开源的):
对象浏览器 - 允许用户查看可用的所有数据和功能对象,包括已加载和已安装的R包中的数据和功能对象.上下文菜单提供快速编辑和绘制数据或加载包的功能.
全功能的Visual Debugger - Debug R脚本,具有步入,步进和步出功能,允许用户在调试时检查和修改R对象
Visual Solution Explorer - 组织,查看,添加,删除,重新排列和部署R脚本.用户可以创建自己的项目模板,以便为新的R项目自动创建一组自定义脚本.可停靠,浮动和选项卡式工具Windows.用于创建个人自定义工作区.
增强的帮助 - 完整的搜索功能和用于功能和数据对象的悬停工具提示.
R代码片段 - 自动生成R代码的填空部分,用于各种分析.工具提示帮助提供了填写代码段的指导.
关于如何通过其他一些noteps ++扩展或R包在notepad ++中获取其中一些的想法?
谢谢,塔尔
我有40个科目,两组,超过15周,有一些测量变量(Y).
我希望有一个情节:x =时间,y = T,线条按主题划分,颜色按组划分.
我发现它可以这样做:
TIME <- paste("week",5:20)
ID <- 1:40
GROUP <- sample(c("a","b"),length(ID), replace = T)
group.id <- data.frame(GROUP, ID)
a <- expand.grid(TIME, ID)
colnames(a) <-c("TIME", "ID")
group.id.time <- merge(a, group.id)
Y <- rnorm(dim(group.id.time)[1], mean = ifelse(group.id.time$GROUP =="a",1,3) )
DATA <- cbind(group.id.time, Y)
qplot(data = DATA,
x=TIME, y=Y,
group=ID,
geom = c("line"),colour = GROUP)
Run Code Online (Sandbox Code Playgroud)
但是现在我想在情节中添加一些东西来显示两组之间的差异(例如,每组的趋势线,有一些CI阴影线) - 怎么办呢?
我记得曾经看过ggplot2可以(轻松地)用geom_smooth来做这件事,但是我错过了一些关于如何使它工作的东西.
此外,我想知道可能有的线条像每个组的箱线图(不同的分位数和围栏的线等等).但我想回答第一个问题会帮我解决第二个问题.
谢谢.
调试我经常使用的函数时
library(debug)
mtrace(FunctionName)
FunctionName(...)
Run Code Online (Sandbox Code Playgroud)
这对我很有用.
但是,有时我试图调试一个我不知道的复杂函数.在这种情况下,我可以发现在该函数内部还有另一个我想"进入"("调试")的函数 - 所以为了更好地理解整个过程是如何工作的.
所以这样做的一种方法是:
library(debug)
mtrace(FunctionName)
FunctionName(...)
# when finding a function I want to debug inside the function, run again:
mtrace(FunctionName.SubFunction)
Run Code Online (Sandbox Code Playgroud)
问题是 - 是否有更好/更智能的方式进行交互式调试(正如我所描述的)我可能会丢失?
ps:我知道SO上有关于这个问题的各种问题(见这里).然而,我无法遇到类似的问题/解决方案.
我希望通过R访问我的Google网站管理员工具的API.
我从这里看到:
http://code.google.com/apis/webmastertools/docs/2.0/reference.html
它需要在https后面获取一个feed并解析它.
有关如何做的任何建议?
我正在寻找在我的大学计算机网格上为多台计算机发送作品的方法.
目前它正在运行Condor并且还提供Hadoop.
因此,我的问题是,我应该尝试将R与Hadoop或Conder连接到我的项目吗?
对于讨论,让我们假设我们正在谈论令人尴尬的并行任务.
ps:我已经看到了CRAN任务视图中描述的资源.
我想修改从hclust对象的绘图生成的树形图中的叶子的属性.最低限度,我想改变颜色,但您可以提供的任何帮助将不胜感激.
我确实尝试过谷歌答案,但我看到的每一个解决方案似乎都比我猜想的要难得多.
r ×10
api ×1
condor ×1
curl ×1
debugging ×1
dendextend ×1
dendrogram ×1
ggplot2 ×1
google-api ×1
google-docs ×1
hadoop ×1
ide ×1
notepad++ ×1
packages ×1
pandoc ×1
phylogeny ×1
plot ×1
windows-7 ×1