标签: panel-data

Rama中的Fama MacBeth标准错误

有谁知道是否有一个包在R中运行Fama-MacBeth回归并计算标准错误?我知道该sandwich软件包及其评估Newey-West标准错误以及提供聚类功能的能力.但是,我没有看到有关Fama-MacBeth的任何事情.

regression r standard-error panel-data

5
推荐指数
1
解决办法
8316
查看次数

测试面板数据中的多重共线性R

我正在使用plm包中运行面板数据回归,R并希望控制解释变量之间的多重共线性.
我知道-package中有vif()函数car,但据我所知,它不能处理面板数据输出.
plm可以做其他的诊断,如单位根测试,但我发现没有方法来计算多重.

有没有办法计算类似的测试vif,或者我可以只将每个变量视为时间序列,省略面板信息并使用car包运行测试?

我无法透露数据,但问题应与所有面板数据模型相关.
该维度大约为1,000个观测值,超过50个时间段.
我使用的代码如下所示:

pdata <- plm.data(RegData, index=c("id","time"))
fixed <- plm(Y~X, data=pdata, model="within")
Run Code Online (Sandbox Code Playgroud)

然后

vif(fixed) 
Run Code Online (Sandbox Code Playgroud)

返回错误.


先感谢您.

regression r panel-data plm

5
推荐指数
1
解决办法
7937
查看次数

来自不平衡面板数据的R样本

我正在使用不平衡的面板数据,我希望从中抽取随机样本,该样本不受每单位不同观察数量的影响.例如,在下面的代码中,IBM被选中的可能性是GOOG的两倍,被选中的可能性是MSFT的五倍.有没有办法对这些数据进行抽样,好像每个公司/年都有相同的被选中概率?可能通过使用采样包?

df <- data.frame(COMPANY=c(rep('IBM',50),rep('GOOG',25),rep('MSFT',10)), YEAR=c(1961:2010,1988:2012,1996:2005), PROFIT=rnorm(85))
df

df[sample(nrow(df), 20, replace=FALSE), ]
Run Code Online (Sandbox Code Playgroud)

r random-sample panel-data

5
推荐指数
1
解决办法
907
查看次数

在 R 中计算内部、之间或整体 R 平方

我正在从 Stata 迁移到 R ( plm package) 以进行面板模型计量经济学。在 Stata 中,随机效应等面板模型通常报告内部、之间和整体 R 平方。

我发现plm随机效应模型中报告的 R 平方对应于内部 R 平方。那么,有没有办法使用plm packagein R获得整体和 R 平方之间的关系?

请参阅 R 和 Stata 的相同示例:

library(plm)
library(foreign) # read Stata files
download.file('http://fmwww.bc.edu/ec-p/data/wooldridge/wagepan.dta','wagepan.dta',mode="wb")
wagepan <- read.dta('wagepan.dta')

# Random effects
plm.re <- plm(lwage ~ educ + black + hisp + exper + expersq + married + union + d81 + d82 + d83 + d84 + d85 + d86 + d87,
              data=wagepan,
              model='random',
              index=c('nr','year'))
summary(plm.re)
Run Code Online (Sandbox Code Playgroud)

在斯塔塔: …

r stata panel-data plm

5
推荐指数
1
解决办法
3392
查看次数

合并面板数据以获得平衡的面板数据

我在面板数据表格中有几个数据框.现在我想将这些面板数据框合并为一个面板数据.这些数据框架之间有共同点和不同点.我说明如下:

DF1:

Month   variable    Beta1   Beta2   Beta3   Beta4   Beta5   Beta6
Jan-05     A        1       2       3       4       5       6
Feb-05     A        2       3       4       5       6       7
Mar-05     A        3       4       5       6       7       8
Apr-05     A        4       5       6       7       8       9
May-05     A        5       6       7       8       9       10
Jun-05     A        6       7       8       9      10       11
Jul-05     A        7       8       9       10     11       12
Aug-05     A        8       9       10      11     12       13
Sep-05     A        9       10      11      12 …
Run Code Online (Sandbox Code Playgroud)

merge r panel-data

5
推荐指数
1
解决办法
1058
查看次数

R 的 xtsum 命令?

我们正在处理面板数据,Stata 中有一个命令,xtsum它可以为您提供数据集中变量的内部方差和方差之间的信息。R 是否有类似的命令可以产生干净的输出?

statistics r stata panel-data

5
推荐指数
1
解决办法
1760
查看次数

具有不同日期解析器的 Pandas read_csv

我有一个包含时间序列数据的 csv 文件,第一列是格式中的日期,%Y:%m:%d第二列是格式为“%H:%M:%S”的日内时间。我想将此 csv 文件导入多索引数据框或面板对象。

使用此代码,它已经可以工作:

    _file_data = pd.read_csv(_file,
                         sep=",",
                         header=0,
                         index_col=['Date', 'Time'],
                         thousands="'",
                         parse_dates=True,
                         skipinitialspace=True
                         )
Run Code Online (Sandbox Code Playgroud)

它以以下格式返回数据:

Date         Time                   Volume
2016-01-04   2018-04-25 09:01:29    53645
             2018-04-25 10:01:29    123
             2018-04-25 10:01:29    1345
             ....
2016-01-05   2018-04-25 10:01:29    123
             2018-04-25 12:01:29    213
             2018-04-25 10:01:29    123
Run Code Online (Sandbox Code Playgroud)

第一个问题:我想将第二个索引显示为纯时间对象而不是日期时间。为此,我必须在 read_csv 函数中声明两个不同的日期传递器,但我不知道如何。做到这一点的“最佳”方法是什么?

第二个问题:创建数据框后,我将其转换为面板对象。你会建议这样做吗?面板对象是这种数据结构的更好选择吗?面板对象的优点(缺点)是什么?

python dataframe pandas panel-data

5
推荐指数
1
解决办法
1392
查看次数

R:terms.default(公式)中的错误:没有术语组件也没有属性(pgmm函数)

我尝试学习如何将 GMM 方法与 R(Arellano-Bond 估计器)结合使用。所以我使用pgmm包中的命令plm

我复制了此示例的代码:https ://www.rdocumentation.org/packages/plm/versions/1.6-5/topics/pgmm

有了这些数据:

Date        country       credit    a   b   c   d   e   f   g    h  i   j   

2000-01-01  Germany     3840,304    0   0   0   0   0   0   1   .b  0   -1
2000-04-01  Germany     3891,104    0   0   0   0   0   0   0   .b  0   0
2000-07-01  Germany     3916,966    0   0   0   0   0   0   0   .b  0   0
2000-10-01  Germany     3984,611    0   0   0   0   0   0   0   .b  0   0
2001-01-01  Germany …
Run Code Online (Sandbox Code Playgroud)

r panel-data plm

5
推荐指数
0
解决办法
1257
查看次数

如何为 LSTM 和 Keras 构建面板数据?

我试图弄清楚如何构建我的数据集并构建 X 和 y,以便它可以与 Keras 的 Stacked LSTM 一起用于序列分类。

我有我试图预测分类的面板数据。我不完全确定如何理解时间步长或如何根据我的面板数据正确制作数据的形状。

# Libraries
from keras.models import Sequential
from keras.layers import LSTM, Dense
import numpy as np
import pandas as pd

# Here is an example of my data
df = pd.read_csv('https://raw.githubusercontent.com/rocketfish88/democ/master/sample2.csv')
df
Run Code Online (Sandbox Code Playgroud)
# Contains a handful of features, a target, year, and id of the observation
   id        year  x1 x2  x3  y
0   A       2015   1   1   1  1
1   A       2016   2   2   2  1
2   A       2017   3   3 …
Run Code Online (Sandbox Code Playgroud)

python panel-data keras

5
推荐指数
0
解决办法
934
查看次数

python中固定效应回归(面板数据)的格式化数据?

我有一个大数据集,需要对其进行时间序列分析。数据目前在excel格式如下:

+----+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+
| ID | Q1 09 variable X | Q2 09 variable X | Q3 09 variable X | Q4 09 variable X | Q1 10 variable X | Q2 10 variable X | Q3 10 variable X | Q4 10 variable X | Q1 09 variable Y | Q2 09 variable Y | Q3 09 variable Y | Q4 09 variable Y | Q1 10 variable Y | Q2 10 variable Y | Q3 10 variable Y | …
Run Code Online (Sandbox Code Playgroud)

python time-series pandas panel-data

5
推荐指数
1
解决办法
177
查看次数