有谁知道是否有一个包在R中运行Fama-MacBeth回归并计算标准错误?我知道该sandwich软件包及其评估Newey-West标准错误以及提供聚类功能的能力.但是,我没有看到有关Fama-MacBeth的任何事情.
我正在使用plm包中运行面板数据回归,R并希望控制解释变量之间的多重共线性.
我知道-package中有vif()函数car,但据我所知,它不能处理面板数据输出.
的plm可以做其他的诊断,如单位根测试,但我发现没有方法来计算多重.
有没有办法计算类似的测试vif,或者我可以只将每个变量视为时间序列,省略面板信息并使用car包运行测试?
我无法透露数据,但问题应与所有面板数据模型相关.
该维度大约为1,000个观测值,超过50个时间段.
我使用的代码如下所示:
pdata <- plm.data(RegData, index=c("id","time"))
fixed <- plm(Y~X, data=pdata, model="within")
Run Code Online (Sandbox Code Playgroud)
然后
vif(fixed)
Run Code Online (Sandbox Code Playgroud)
返回错误.
先感谢您.
我正在使用不平衡的面板数据,我希望从中抽取随机样本,该样本不受每单位不同观察数量的影响.例如,在下面的代码中,IBM被选中的可能性是GOOG的两倍,被选中的可能性是MSFT的五倍.有没有办法对这些数据进行抽样,好像每个公司/年都有相同的被选中概率?可能通过使用采样包?
df <- data.frame(COMPANY=c(rep('IBM',50),rep('GOOG',25),rep('MSFT',10)), YEAR=c(1961:2010,1988:2012,1996:2005), PROFIT=rnorm(85))
df
df[sample(nrow(df), 20, replace=FALSE), ]
Run Code Online (Sandbox Code Playgroud) 我正在从 Stata 迁移到 R ( plm package) 以进行面板模型计量经济学。在 Stata 中,随机效应等面板模型通常报告内部、之间和整体 R 平方。
我发现plm随机效应模型中报告的 R 平方对应于内部 R 平方。那么,有没有办法使用plm packagein R获得整体和 R 平方之间的关系?
请参阅 R 和 Stata 的相同示例:
library(plm)
library(foreign) # read Stata files
download.file('http://fmwww.bc.edu/ec-p/data/wooldridge/wagepan.dta','wagepan.dta',mode="wb")
wagepan <- read.dta('wagepan.dta')
# Random effects
plm.re <- plm(lwage ~ educ + black + hisp + exper + expersq + married + union + d81 + d82 + d83 + d84 + d85 + d86 + d87,
data=wagepan,
model='random',
index=c('nr','year'))
summary(plm.re)
Run Code Online (Sandbox Code Playgroud)
在斯塔塔: …
我在面板数据表格中有几个数据框.现在我想将这些面板数据框合并为一个面板数据.这些数据框架之间有共同点和不同点.我说明如下:
DF1:
Month variable Beta1 Beta2 Beta3 Beta4 Beta5 Beta6
Jan-05 A 1 2 3 4 5 6
Feb-05 A 2 3 4 5 6 7
Mar-05 A 3 4 5 6 7 8
Apr-05 A 4 5 6 7 8 9
May-05 A 5 6 7 8 9 10
Jun-05 A 6 7 8 9 10 11
Jul-05 A 7 8 9 10 11 12
Aug-05 A 8 9 10 11 12 13
Sep-05 A 9 10 11 12 …Run Code Online (Sandbox Code Playgroud) 我们正在处理面板数据,Stata 中有一个命令,xtsum它可以为您提供数据集中变量的内部方差和方差之间的信息。R 是否有类似的命令可以产生干净的输出?
我有一个包含时间序列数据的 csv 文件,第一列是格式中的日期,%Y:%m:%d第二列是格式为“%H:%M:%S”的日内时间。我想将此 csv 文件导入多索引数据框或面板对象。
使用此代码,它已经可以工作:
_file_data = pd.read_csv(_file,
sep=",",
header=0,
index_col=['Date', 'Time'],
thousands="'",
parse_dates=True,
skipinitialspace=True
)
Run Code Online (Sandbox Code Playgroud)
它以以下格式返回数据:
Date Time Volume
2016-01-04 2018-04-25 09:01:29 53645
2018-04-25 10:01:29 123
2018-04-25 10:01:29 1345
....
2016-01-05 2018-04-25 10:01:29 123
2018-04-25 12:01:29 213
2018-04-25 10:01:29 123
Run Code Online (Sandbox Code Playgroud)
第一个问题:我想将第二个索引显示为纯时间对象而不是日期时间。为此,我必须在 read_csv 函数中声明两个不同的日期传递器,但我不知道如何。做到这一点的“最佳”方法是什么?
第二个问题:创建数据框后,我将其转换为面板对象。你会建议这样做吗?面板对象是这种数据结构的更好选择吗?面板对象的优点(缺点)是什么?
我尝试学习如何将 GMM 方法与 R(Arellano-Bond 估计器)结合使用。所以我使用pgmm包中的命令plm。
我复制了此示例的代码:https ://www.rdocumentation.org/packages/plm/versions/1.6-5/topics/pgmm
有了这些数据:
Date country credit a b c d e f g h i j
2000-01-01 Germany 3840,304 0 0 0 0 0 0 1 .b 0 -1
2000-04-01 Germany 3891,104 0 0 0 0 0 0 0 .b 0 0
2000-07-01 Germany 3916,966 0 0 0 0 0 0 0 .b 0 0
2000-10-01 Germany 3984,611 0 0 0 0 0 0 0 .b 0 0
2001-01-01 Germany …Run Code Online (Sandbox Code Playgroud) 我试图弄清楚如何构建我的数据集并构建 X 和 y,以便它可以与 Keras 的 Stacked LSTM 一起用于序列分类。
我有我试图预测分类的面板数据。我不完全确定如何理解时间步长或如何根据我的面板数据正确制作数据的形状。
# Libraries
from keras.models import Sequential
from keras.layers import LSTM, Dense
import numpy as np
import pandas as pd
# Here is an example of my data
df = pd.read_csv('https://raw.githubusercontent.com/rocketfish88/democ/master/sample2.csv')
df
Run Code Online (Sandbox Code Playgroud)
# Contains a handful of features, a target, year, and id of the observation
id year x1 x2 x3 y
0 A 2015 1 1 1 1
1 A 2016 2 2 2 1
2 A 2017 3 3 …Run Code Online (Sandbox Code Playgroud) 我有一个大数据集,需要对其进行时间序列分析。数据目前在excel格式如下:
+----+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+------------------+
| ID | Q1 09 variable X | Q2 09 variable X | Q3 09 variable X | Q4 09 variable X | Q1 10 variable X | Q2 10 variable X | Q3 10 variable X | Q4 10 variable X | Q1 09 variable Y | Q2 09 variable Y | Q3 09 variable Y | Q4 09 variable Y | Q1 10 variable Y | Q2 10 variable Y | Q3 10 variable Y | …Run Code Online (Sandbox Code Playgroud) panel-data ×10
r ×7
plm ×3
python ×3
pandas ×2
regression ×2
stata ×2
dataframe ×1
keras ×1
merge ×1
statistics ×1
time-series ×1