我在R中与日期和时间斗争,但我希望这是一个相当基本的任务.
这是我的数据集:
> str(temp.df)
'data.frame': 74602 obs. of 2 variables:
$ time : POSIXct, format: "2011-04-09 03:53:20" "2011-04-09 03:53:15" "2011-04-09 03:53:07" "2011-04-09 03:52:39" ...
$ value: num 1 1 1 1 1 1 1 1 1 1 ...
> head(temp.df$time, n=10)
[1] "2011-04-09 03:53:20 EDT" "2011-04-09 03:53:15 EDT" "2011-04-09 03:53:07 EDT" "2011-04-09 03:52:39 EDT"
[5] "2011-04-09 03:52:29 EDT" "2011-04-09 03:51:56 EDT" "2011-04-09 03:51:54 EDT" "2011-04-09 03:51:46 EDT"
[9] "2011-04-09 03:51:44 EDT" "2011-04-09 03:51:26 EDT"
Run Code Online (Sandbox Code Playgroud)
为方便起见......
> dput(head(temp.df$time, n=10))
structure(c(1302335600, 1302335595, …Run Code Online (Sandbox Code Playgroud) 我是XPath的新手,但我可以看到它有多强大.我正在查看此链接的源代码,只是想从以下两个页面中提取内容和用户名,为简单起见,它们位于源代码顶部附近.
content ="[存档] Simburgur的直播[离线]战争机器3"
<div class="username">Simburgur</div>
Run Code Online (Sandbox Code Playgroud)
这是我在R中的代码:
doc <- htmlParse("http://forums.epicgames.com/archive/index.php/t-672775.html")
xpathSApply(doc, "//head/meta[@name=\"description\"]")
Run Code Online (Sandbox Code Playgroud)
返回
[[1]]
<meta name="description" content="[Archive] Simburgur's Live Stream [Offline] Gears of War 3" />
Run Code Online (Sandbox Code Playgroud)
显然,在这个例子中,我想要的只是内容引用内的内容=但是卡住了,似乎无法让我的表达式返回我想要的字符串.
我重复.我是XPath的新手.:)
我试图玩,Shiny并试图运行基本的开箱即用的例子.没有骰子.
我试图谷歌问题,但一切似乎解决了在外部服务器上运行它时的问题.
也许我错了,但我认为这个应用程序将在我的浏览器中运行localhost.
这是我做的:
install.packages("shiny")
library(shiny)
runExample("01_hello")
Run Code Online (Sandbox Code Playgroud)
这是错误:
> runExample("01_hello")
Listening on port 8100
Error in startServer("0.0.0.0", port, httpuvCallbacks) :
Failed to create server
Run Code Online (Sandbox Code Playgroud)
为了完整起见,这是我的会议信息:
> sessionInfo()
R version 3.0.1 (2013-05-16)
Platform: x86_64-apple-darwin10.8.0 (64-bit)
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
attached base packages:
[1] stats graphics grDevices utils datasets methods base
other attached packages:
[1] shiny_0.7.0
loaded via a namespace (and not attached):
[1] bitops_1.0-5 caTools_1.14 digest_0.6.3 httpuv_1.1.0 RJSONIO_1.0-3 tools_3.0.1 xtable_1.7-1
Run Code Online (Sandbox Code Playgroud) 如果已经以不同的方式提出这个问题,我很抱歉,但是找不到任何想要的东西.
我真的从其他软件包(SPSS)进入R.当我了解真正可以做到的事情时,我意识到我需要额外的"工具".这让我想到了我的问题.
你有什么设置来开发R代码?在不久的将来,我无法看到自己在任何地方开发r包,但我确实看到自己想要有效地管理我的r项目,以及在LaTeX中创建报告和演示文稿.
对于上下文,我在Eclipse for Windows中开发我的R代码,但是我很难成功设置Latex/Sweave和Github插件.
最后,您使用Windows或其他东西开发代码吗?
非常感谢您提供的任何洞察力.
我正在尝试使用RODBC将数据从Oracle数据集市提取到R中.我已经能够解决我的一些问题,但我有一个基本问题.
如何保留数据库中的格式?
使用以下命令
uapp <- sqlQuery(ch, SQL, stringsAsFactors=F)
Run Code Online (Sandbox Code Playgroud)
我的数据按预期检索,但是当它们应该是字符时,某些字段在R中转换为数字和逻辑一次.如果我使用,我可以解决这个问题:
uapp <- sqlQuery(ch, SQL, stringsAsFactors=F, as.is=T)
Run Code Online (Sandbox Code Playgroud)
但我"丢失"列格式化为我希望它们的日期.
上班时我无法避开窗户.因此,我有第二台机器用于完成所有繁重的工作和数据分析.在理想的世界中,我可以创建一个Shiny应用程序,并从我工作的本地网络上的另一台计算机访问它.
我的IT人员提出的解决方案是使用远程桌面,它可以工作,但我真的不希望其他用户锁定机器.
有没有人能够了解我如何允许我的网络上的计算机查看我的Shiny应用程序?我应该在我的第二台机器上拥有管理员权限,以防我需要调整一些设置.
编辑: 虽然我的理想用例是Shiny,但我还想访问其他基于R的报告,如Slidify演示文稿,编译的R Markdown报告,以及编译为独立网站的Gitbooks.
提前致谢.
我是Python的新手(我也没有任何编程培训),所以在我提问时请记住这一点.
我正在尝试搜索检索到的网页,并使用指定的模式查找所有链接.我已经在其他脚本中成功完成了这项工作,但我收到的错误是
Run Code Online (Sandbox Code Playgroud)raise error, v # invalid expressionsre_constants.error:多次重复
我不得不承认我不知道为什么,但同样,我是Python和正则表达式的新手.但是,即使我不使用模式并使用特定链接(只是为了测试匹配),我也不相信我会返回任何匹配(当我打印match.group(0)时,没有任何内容发送到窗口.链接我测试的是下面评论的.
有任何想法吗?通过示例学习通常更容易,但是您可以给予的任何建议都非常感谢!
獾
import urllib2
from BeautifulSoup import BeautifulSoup
import re
url = "http://forums.epicgames.com/archive/index.php?f-356-p-164.html"
page = urllib2.urlopen(url).read()
soup = BeautifulSoup(page)
pattern = r'<a href="http://forums.epicgames.com/archive/index.php?t-([0-9]+).html">(.?+)</a> <i>((.?+) replies)'
#pattern = r'href="http://forums.epicgames.com/archive/index.php?t-622233.html">Gears of War 2: Horde Gameplay</a> <i>(20 replies)'
for match in re.finditer(pattern, page, re.S):
print match(0)
Run Code Online (Sandbox Code Playgroud) 我希望arulesSequences在R中使用该软件包.但是,我不知道如何将我的数据框强制转换为可以利用此软件包的对象.
这是一个复制我的数据结构的玩具数据集:
ids <- c(rep("X", 5), rep("Y", 5), rep("Z", 5))
seq <- rep(1:5,3)
val <- sample(LETTERS, 15, replace=T)
df <- data.frame(ids, seq, val)
df
ids seq val
1 X 1 T
2 X 2 H
3 X 3 V
4 X 4 A
5 X 5 X
6 Y 1 D
7 Y 2 B
8 Y 3 A
9 Y 4 D
10 Y 5 P
11 Z 1 Q
12 Z 2 R
13 Z 3 …Run Code Online (Sandbox Code Playgroud)