我正在处理一个带有月变量的data.frame,该变量只有年和月组件.部分数据如下:
month DIV MKTP
1 1941-12 0.005752218 -4.87
2 1942-01 0.005767111 0.79
3 1942-02 0.005781771 -2.46
4 1942-03 0.005859665 -6.58
5 1942-04 0.005906924 -4.37
6 1942-05 0.005890041 5.94
7 1942-06 0.005941640 2.69
8 1942-07 0.005962464 3.51
9 1942-08 0.005936732 1.80
10 1942-09 0.006007593 2.61
Run Code Online (Sandbox Code Playgroud)
我想将month变量转换为yearmon格式以进行子目的.我的代码如下:
require(zoo,dplyr)
df %>%
mutate(month = as.yearmon(month)) %>%
filter(month >= as.yearmon("1942-3") & month <= as.yearmon("1942-8"))
Run Code Online (Sandbox Code Playgroud)
我想知道lubridate包是否具有与yearmon类似的功能,可以输入年和月的组合.
我一直在使用R进行公司财务和资产定价方面的研究,并且由于我在数学和统计方面的背景,我非常喜欢它.到目前为止,我在R中遇到了两个主要的约束.第一个是处理大数据文件,但我有点通过将R与PostgreSQL和Spark结合起来避开它,我相信我可以从高性能计算机或AWS云获得更多内存在将来.第二个约束是执行速度(对于通过刻度安全报价数据处理滴答很重要),我被推荐Julia比R具有巨大的速度优势.我的问题是,由于Rcpp提供了非常快的执行速度,Julia的速度优势仍然存在保持?我在考虑是否应该学习朱莉娅.
此外,R提供了与WRDS,Quandl,TrueFX和TAQ的完美数据库连接,我真的习惯了Hadley Wickham风格的数据清理.作为一名学者,我有点像R得到了像Journal of Stat Software这样的同行评审期刊的支持.我会试试朱莉娅,看看它是如何运作的.感谢所有的答案和评论!