小编hia*_*ics的帖子

在目录中导入最新的 csv 文件

目标:
- 将本地目录中的最新文件 (.csv) 导入 R

目标详细信息:
- 每天在我的 Mac 上将一个 csv 文件上传到一个文件夹。我希望能够在我的 R 脚本中加入一个函数,该函数会自动将最新文件导入我的工作区以进行进一步分析。该文件每天在凌晨 4:30 左右上传
- 我希望此功能在早上运行(不早于早上 6 点,因此这里有足够的时间留出时间)

输入详细信息:
- 文件类型:.csv
- 命名约定:示例文件名:“28 Jul 2014 04:37:47 -0400.csv”
- 频率:每日导入 @ ~ 04:30

我尝试过的:
- 我知道这似乎是一个微弱的尝试,但我真的不知道如何修改下面的这个功能。
- 我在纸上的想法是“抓取”最新文件的 id,而不是在目录名称前面粘贴(),然后是中提琴!(但可惜我的编程技能缺乏在这里编写代码)
- 下面的代码是尝试运行的代码,但它只是“挂起”并且没有完成。我从这个R 论坛得到了这个代码,在这里找到

代码:

lastChange = file.info(directory)$mtime 
while(TRUE){ 
  currentM = file.info(directory)$mtime 
  if(currentM != lastChange){ 
    lastChange = currentM 
    read.csv(directory) 
  } 
  # try again in 10 minutes 
  Sys.sleep(600) 
} 
Run Code Online (Sandbox Code Playgroud)

我的环境:
- R 3.1
- Mac OS X 10.9.4(小牛队) …

csv directory import automation r

5
推荐指数
3
解决办法
2714
查看次数

将 xls 文件从 url 下载到数据框(Rcurl)中?

我正在尝试将以下网址下载到 R 数据框中:

http://www.fantasypros.com/nfl/rankings/qb.php/?export=xls

(这是公共页面上的“导出”链接:http://www.fantasypros.com/nfl/rankings/qb.php/

但是,我不确定如何“解析”数据?我还希望将其自动化并每周执行一次,因此任何有关如何将其构建为每周访问工作流程的想法将不胜感激!已经在 google 搜索和 stackoverflow 上搜索了几个小时了,但没有结果......:-)

谢谢你,

贾斯汀

尝试的代码:

getURL("http://www.fantasypros.com/nfl/rankings/qb.php?export=xls")

这只是给了我一个开头如下的字符串:

[1] "FantasyPros.com \t \nWeek 8 - QB Rankings \t \nExpert Consensus Rankings (ECR) \t \n\n Rank \t Player Name \tTeam \t Matchup \tBest Rank \t Worst Rank \t Ave Rank \t Std Dev \t\n1\tPeyton Manning\tDEN\t vs. WAS\t1\t5\t1.2105263157895\t0.58877509625419\t\t\n2\tDrew Brees\tNO\t vs. BUF\t1\t7\t2.6287878787879\t1.0899353819483\t\t\n3\tA...

xls r geturl rcurl

3
推荐指数
1
解决办法
8535
查看次数

标签 统计

r ×2

automation ×1

csv ×1

directory ×1

geturl ×1

import ×1

rcurl ×1

xls ×1