如何在 Stata 中创建日期序列?

use*_*943 2 date stata

我想在 Stata 中创建一个日期序列。在此论坛和其他论坛上的搜索没有为 Stata 提供任何有用的代码。R 有很多答案,例如链接所示。我想创建一个从 2000 年 1 月 1 日到 2010 年 12 月 31 日的序列。我该怎么做?

Nic*_*Cox 5

在任何软件中,日期都可能很棘手。在 Stata 中,与任何其他软件一样,仔细阅读文档确实是无可替代的。help dates and times回答了大多数问题。一个可能会让不小心的人陷入困境的是, Stata 中有一个用于创建每日date()日期变量的函数,而不是其他类型。从 Stata 13 开始,新用户在查找每日日期时最好使用同义功能。也就是说,另一个函数在这里创建日期序列更方便,.daily()mdy()

这是一个例子:

clear 
di mdy(1,1,2000)
di mdy(12,31,2010)
di mdy(12,31,2010) - mdy(1,1,2000)
set obs 4018
gen mydate = mdy(12,31,1999) + _n
format mydate %td
list in 1
list in L 
Run Code Online (Sandbox Code Playgroud)

笔记:

  1. mdy()从指示月、日和年的参数创建每日日期变量。

  2. _n是观察数,1 向上。

  3. 因此,您需要计算出开始日期和所需的观察数量,然后只需将所需的常量添加到 即可_n

  4. Stata 的工作日期为 1960 年 1 月 1 日,但此解决方案并不依赖于您是否了解这一点。

PS 在现已删除的答案中,@Caty 似乎要求提供一系列每月日期。这是一个编辑版本:

当我尝试这样做时,我的日期看起来像这样 01jan2000, 02jan2000。但它们应该是每月的:01jan2000、01feb2000。

如果您有每月数据,那么使用每月第一天的每日日期完全没有必要,也没有任何优势,至少就 Stata 而言是这样。事实上,通过创建这样的序列,您可以创建一个具有 27、28、29 和 30 天不同长度的间隙的序列,因此甚至不是一个规则间隔的序列。这些差距将使 Stata 中的许多分析变得尴尬,甚至有些无法进行。类似的评论也适用于季度。(如果你有几周的时间,间隔 7 天的每日约会是最好的框架,这是另一个故事。)

clear 
di ym(2000, 1)
di ym(2010, 12)
di ym(2010, 1) - ym(2000,1)
set obs 121 
gen mydate = ym(1999, 12) + _n
format mydate %tm 
l in 1
l in L 
Run Code Online (Sandbox Code Playgroud)

笔记:

  1. ym()从指示年份和月份的参数创建每月日期变量。

  2. _n是观察数,1 向上。

  3. 因此,您需要计算出开始日期和所需的观察数量,然后只需将所需的常量添加到 即可_n

  4. Stata 的工作日期为 1960 年 1 月,但此解决方案并不依赖于您是否了解这一点。

编辑 月末每日序列很容易使用一个技巧,您可能会因为没有立即看到而踢自己。假设我们想要 2015 年 1 月到 2016 年 12 月的结束时间。那么每个月的结束时间正好是下个月开始的前一天。无需担心不同长度的月份或闰年。Stata 知道日历的详细信息,因此您不必告诉它它们是什么。

. clear

. set obs 24 
number of observations (_N) was 0, now 24

. gen mdate = ym(2015, 1) + _n 

. gen ddate = dofm(mdate) - 1 

. format %td ddate

. format %tm mdate 

. list 

     +---------------------+
     |   mdate       ddate |
     |---------------------|
  1. |  2015m2   31jan2015 |
  2. |  2015m3   28feb2015 |
  3. |  2015m4   31mar2015 |
  4. |  2015m5   30apr2015 |
  5. |  2015m6   31may2015 |
     |---------------------|
  6. |  2015m7   30jun2015 |
  7. |  2015m8   31jul2015 |
  8. |  2015m9   31aug2015 |
  9. | 2015m10   30sep2015 |
 10. | 2015m11   31oct2015 |
     |---------------------|
 11. | 2015m12   30nov2015 |
 12. |  2016m1   31dec2015 |
 13. |  2016m2   31jan2016 |
 14. |  2016m3   29feb2016 |
 15. |  2016m4   31mar2016 |
     |---------------------|
 16. |  2016m5   30apr2016 |
 17. |  2016m6   31may2016 |
 18. |  2016m7   30jun2016 |
 19. |  2016m8   31jul2016 |
 20. |  2016m9   31aug2016 |
     |---------------------|
 21. | 2016m10   30sep2016 |
 22. | 2016m11   31oct2016 |
 23. | 2016m12   30nov2016 |
 24. |  2017m1   31dec2016 |
     +---------------------+
Run Code Online (Sandbox Code Playgroud)

  • “l”是“list”的最小缩写,“in 1”和“in L”表示第一个和最后一个观察值。`in l` 也是允许的。 (2认同)