Datasets para R

Introducción a la econometría, Wooldridge

 Una  explicación antes de comenzar.

 

Esta página contiene ejemplos de cada capítulo de  Introducción a la Econometría :  Un Enfoque Moderno,  4a  edición de Jeffrey M. Wooldridge.  Cada ejemplo ilustra cómo cargar los datos, construir modelos econométricos  y calcular estimaciones con el programa R .

El sitio de recursos complementario al libro proporciona conjuntos de datos disponibles públicamente para Eviews, Excel, y el software comercial Stata, R es la opción de software libre.

Además, el uso de R al construir una base en el modelado econométrico introduce uno a las herramientas de software capaces de escalar con las demandas de los métodos modernos en computación estadística. En el Apéndice  se citan fuentes adicionales sobre el uso de R para la econometría.

Los estudiantes nuevos tanto en econometría como en paquete R pueden considerar que la introducción a ambos es compleja. En particular, el proceso de carga y preparación de datos antes de construir el primer modelo econométrico resulta frustrante debido a que no es amigable el programa y cualquier error se constituye en una verdadera complicación. El  paquete de datos  wooldridge tiene como objetivo simplificar esta tarea. Contiene el conjunto de datos de Introducción a la Econometría :  Un Enfoque Moderno, que se puede cargar con una simple llamada a la función data().

Lo primero es  instalar y carga el paquete  wooldridge con el comando install. Para aquellos familiarizados con Stata saben que contiene bases de datos precargadas y con el paquete. Pero con el uso regular de libros de texto, los autores ponen disponibles los datos no sólo en la forma regular a través de archivos indivuales. Ahora también se tiene la costrumbre de instalar directamente la biblioteca completa de bases de datos, en este caso los 111 archivos indivuales es cargan directamente con un sólo proceso.

install.packages("wooldridge")
library(wooldridge)

Capítulo 2: El modelo de regresión simple

Example 2.10: Una ecuación de salario de registro

gg)1.β0β1dclogramo(wungramomi)^=β0+β1miretudo

Cargue los wage1datos y revise la documentación.

data("wage1")
?wage1

Estos son datos de la Encuesta de Población Actual de 1976, recopilada por Henry Farber cuando él y Wooldridge fueron colegas en el MIT en 1988.

Estime una relación lineal entre el registro de salario y educación .

log_wage_model <- lm(lwage ~ educ, data = wage1)

Imprimir los resultados. Estoy usando el stargazerpaquete para imprimir los resultados del modelo en un formato limpio y fácil de leer. Ver la bibliografía para más información.

Variable dependiente:
lwage
educ 0.083 *** (0.008)
Constante 0.584 *** (0.097)
Observaciones 526
2 0.186
2 ajustado 0.184
Residual Std. Error 0.480 (df = 524)
Estadística F 119.582 *** (df ​​= 1; 524)
Nota: p <0.1; p <0.05; p <0.01

Capítulo 3: Análisis de regresión múltiple: estimación

Example 3.2: Ecuación de salario por hora

gg)1.β0β1dβ3β4elogramo(wungramomi)^=β0+β1miretudo+β3miXpagmir+β4tminorteturmi

Estime el modelo de regresión de la educación , la experiencia y la tenencia contra el registro (salario) . Los wage1datos aún deberían estar en su entorno de trabajo.

hourly_wage_model <- lm(lwage ~ educ + exper + tenure, data = wage1)

Imprima los coeficientes estimados del modelo:

Variable dependiente:
lwage
educ 0.092 *** (0.007)
exper 0.004 ** (0.002)
tenencia 0.022 *** (0.003)
Constante 0.284 *** (0.104)
Observaciones 526
2 0.316
2 ajustado 0.312
Residual Std. Error 0.441 (df = 522)
Estadística F 80.391 *** (df ​​= 3; 522)
Nota: p <0.1; p <0.05; p <0.01

Capítulo 4: Análisis de regresión múltiple: inferencia

Example 4.7 Efecto de la capacitación laboral sobre las tasas de desecho de la empresa

Cargue el jtrainconjunto de datos y si está utilizando R Studio, Viewel conjunto de datos.

data("jtrain")

De H. Holzer, R. Block, M. Cheatham y J. Knott (1993), ¿Los subsidios de capacitación son efectivos? The Michigan Experience , Industrial and Labour Relations Review 46, 625-636. Los autores amablemente proporcionaron los datos.

?jtrain
View(jtrain)

Cree un índice lógico, identificando qué observaciones ocurren en 1987 y son no-unión.

index <- jtrain$year == 1987 & jtrain$union == 0

A continuación, subconjunta los datos de jtrain por el nuevo índice. Esto devuelve un data.frame de jtraindatos de empresas no sindicalizadas para el año 1987.

jtrain_1987_nonunion <- jtrain[index, ]

Ahora cree el modelo lineal regresivo hrsemp(horas totales de capacitación / total de empleados capacitados), el lsales(registro de ventas anuales) y lemploy(el registro del número de empleados), en contra lscrap(el registro de la tasa de raspado).

α β1β2β3ylsdorunpag=α+β1hrsmimetropag+β2lsunlmis+β3lmimetropagloy
linear_model <- lm(lscrap ~ hrsemp + lsales + lemploy, data = jtrain_1987_nonunion)

Finalmente, imprima el diagnóstico estadístico de resumen completo del modelo.

Variable dependiente:
lscrap
hrsemp -0.029 (0.023)
lsales -0,962 ** (0,453)
lemploy 0,761 * (0,407)
Constante 12.458 ** (5.687)
Observaciones 29
2 0.262
2 ajustado 0.174
Residual Std. Error 1.376 (df = 25)
Estadística F 2.965 * (df ​​= 3; 25)
Nota: p <0.1; p <0.05; p <0.01

Capítulo 5: Análisis de regresión múltiple: Asintóticos OLS

Example 5.3: Modelo económico del crimen

De J. Grogger (1991), Certeza vs. Severidad de castigo , Economic Inquiry 29, 297-309. El profesor Grogger amablemente proporcionó un subconjunto de los datos que utilizó en su artículo.

86 β0β1β2gβ3β486 β5q86 μnorteunrr86=β0+β1pagdonortev+β2unvgramosminorte+β3tottyometromi+β4pagtyometromi86+β5qmimetropag86+μ

86 :norteunrr86:número de veces arrestado, 1986. pcnv:
pagdonortev:proporción de detenciones previas que conducen a condenas avg
:unvgramosminorte:oración promedio cumplida, duración en meses. tottime:
tottyometromi:tiempo en prisión desde que cumplió 18 años, duración en meses. ptime86:
pagtyometromi86:meses de prisión durante 1986. q
86 :qmimetropag86: cuartos empleados, 1986.

Cargue el crime1conjunto de datos.

data("crime1")
?crime1

Estime el modelo.

restricted_model <- lm(narr86 ~ pcnv + ptime86 + qemp86, data = crime1)

Crea una nueva variable que restricted_model_ucontenga los residuos μ~μ~ de la regresión anterior.

restricted_model_u <- restricted_model$residuals

A continuación, regresión pcnv, ptime86, qemp86, avgsen, y tottime, contra los residuos μ~μ~guardado en restricted_model_u.

μ~β1β2gβ3β486 β5q86μ~=β1pagdonortev+β2unvgramosminorte+β3tottyometromi+β4pagtyometromi86+β5qmimetropag86
LM_u_model <- lm(restricted_model_u ~ pcnv + ptime86 + qemp86 + avgsen + tottime, 
    data = crime1)
summary(LM_u_model)$r.square
## [1] 0.001493846
M725 0.0015 )LMETRO=2,725(0.0015)
LM_test <- nobs(LM_u_model) * 0.0015
LM_test
## [1] 4.0875
qchisq(1 - 0.10, 2)
## [1] 4.60517

El p- valor es:

PAGX224.09 ≈ 0.129PAG(X22>4.09)≈0.129
1-pchisq(LM_test, 2)
## [1] 0.129542

Capítulo 6: Regresión múltiple: otros problemas

Example 6.1: Efectos de la contaminación en los precios de la vivienda, estandarizados.

β0β1β2β3β4reyo β5μpagryodomi=β0+β1norteoX+β2doryometromi+β3roometros+β4reyost+β5struntyoo+μ

epagryodomi: precio medio de la vivienda.

xnorteoX: Concentración de óxido nitroso; partes por millón.

edoryometromi: número de crímenes reportados per capita.

sroometros: número promedio de habitaciones en casas en la comunidad.

retreyost: distancia ponderada de la comunidad a 5 centros de empleo.

ostruntyoo: proporción promedio de alumnos por maestro en las escuelas de la comunidad.

ze1.β1zβ2zβ3zβ4zreyo β5zozpagryodomi^=β1znorteoX+β2zdoryometromi+β3zroometros+β4zreyost+β5zstruntyoo

Cargue los hprice2datos y vea la documentación.

data("hprice2")
?hprice2

Datos de Hedonic Housing Prices y Demand for Clean Air , por Harrison, D. y DLRubinfeld, Journal of Environmental Economics and Management 5, 81-102. Diego García, un ex Ph.D. estudiante de economía en el MIT, amablemente proporcionó estos datos, que obtuvo del libro Regression Diagnostics: Identifying Influential Data and Sources of Collinearity, por DA Belsey, E. Kuh, y R. Welsch, 1990. Nueva York: Wiley.

Estime el coeficiente con el lmmodelo de regresión habitual , pero esta vez, coeficientes estandarizados envolviendo cada variable con la scalefunción de R :

housing_standard <- lm(scale(price) ~ 0 + scale(nox) + scale(crime) + scale(rooms) + 
    scale(dist) + scale(stratio), data = hprice2)
Variable dependiente:
escala (precio)
escala (nox) -0.340 *** (0.044)
escala (crimen) -0.143 *** ( 0.031 )
escala (habitaciones) 0.514 *** (0.030)
escala (dist) -0.235 *** (0.043)
escala (stratio) -0.270 *** (0.030)
Observaciones 506
2 0.636
2 ajustado 0.632
Residual Std. Error 0.606 (df = 501)
Estadística F 174.822 *** (df ​​= 5; 501)
Nota: p <0.1; p <0.05; p <0.01

Example 6.2: Efectos de la contaminación en los precios de la vivienda, término interactivo cuadrático

Modificar el modelo de vivienda, agregando un término cuadrático en las habitaciones :

gβ0β1gβ2gdβ3β4s2β5μlogramo(pagryodomi)=β0+β1logramo(norteoX)+β2logramo(reyost)+β3roometros+β4roometros2+β5struntyoo+μ
housing_interactive <- lm(lprice ~ lnox + log(dist) + rooms+I(rooms^2) + stratio, data = hprice2)

Compare los resultados con el modelo de example 6.1.

Variable dependiente:
escala (precio) lprice
(1) (2)
escala (nox) -0.340 *** (0.044)
escala (crimen) -0.143 *** ( 0.031 )
escala (habitaciones) 0.514 *** (0.030)
escala (dist) -0.235 *** (0.043)
escala (stratio) -0.270 *** (0.030)
lnox -0.902 *** ( 0.115 )
log (dist) -0.087 ** (0.043)
habitaciones -0.545 *** (0.165)
Yo (habitaciones2) 0.062 *** (0.013)
stratio -0.048 *** (0.006)
Constante 13.385 *** (0.566)
Observaciones 506 506
2 0.636 0.603
2 ajustado 0.632 0.599
Residual Std. Error 0.606 (df = 501) 0,259 (df = 500)
Estadística F 174.822 *** (df ​​= 5; 501) 151.770 *** (df ​​= 5; 500)
Nota: p <0.1; p <0.05; p <0.01
0.587
Residual Std. Error 1.843 (df = 53)
Estadística F 40.094 *** (df ​​= 2; 53)
Nota: p <0.1; p <0.05; p <0.01

Example 10.11: Efectos estacionales de las presentaciones antidumping

CM Krupp y PS Pollard (1999), Las respuestas del mercado a las leyes antidumping: algunas pruebas de la industria química de los Estados Unidos , Canadian Journal of Economics 29, 199-227. El Dr. Krupp amablemente proporcionó los datos. Son datos mensuales que abarcan desde febrero de 1978 hasta diciembre de 1988.

data("barium")
?barium
barium_imports <- lm(lchnimp ~ lchempi + lgas + lrtwex + befile6 + affile6 + 
    afdec6, data = barium)

Estime un nuevo modelo, barium_seasonalque tenga en cuenta la estacionalidad mediante la adición de variables ficticias contenidas en los datos. Calcule el anovaentre los dos modelos.

barium_seasonal <- lm(lchnimp ~ lchempi + lgas + lrtwex + befile6 + affile6 + 
    afdec6 + feb + mar + apr + may + jun + jul + aug + sep + oct + nov + dec, 
    data = barium)
barium_anova <- anova(barium_imports, barium_seasonal)
Variable dependiente:
lchnimp
(1) (2)
lchempi 3.117 *** (0.479) 3.265 *** (0.493)
lgas 0.196 (0.907) -1.278 (1.389)
lrtwex 0,983 ** (0,400) 0,663 (0,471)
befile6 0.060 (0.261) 0.140 (0.267)
affile6 -0.032 (0.264) 0.013 (0.279)
afdec6 -0.565 * (0.286) -0.521 * (0.302)
feb -0.418 (0.304)
mar 0.059 (0.265)
abr -0.451 * (0.268)
mayo 0.033 (0.269)
jun -0.206 (0.269)
jul 0.004 (0.279)
ago -0.157 (0.278)
sep -0.134 (0.268)
oct 0.052 (0.267)
nov -0.246 (0.263)
dic 0.133 (0.271)
Constante -17.803 (21.045) 16.779 (32.429)
Observaciones 131 131
2 0.305 0.358
2 ajustado 0.271 0.262
Residual Std. Error 0.597 (df = 124) 0.601 (df = 113)
Estadística F 9.064 *** (df ​​= 6; 124) 3.712 *** (df ​​= 17; 113)
Nota: p <0.1; p <0.05; p <0.01
Estadística norte Media St. Dev. Min. Max
Res.Df 2 118.500 7.778 113 124
RSS 2 42.545 2.406 40.844 44.247
Df 1 11,000 11 11
Suma de Sq 1 3.403 3.403 3.403
F 1 0.856 0.856 0.856
Pr (> F) 1 0.585 0.585 0.585

Econometría Aplicada con R

es mi proyecto registrado en el Consejo Divisional de la DCSH.

Este proyecto presenta  los métodos de la  econometría aplicada que utiliza el sistema R para computación y gráficos estadísticos. Presenta ejemplos prácticos para una amplia gama de modelos econométricos, desde modelos de regresión lineal clásicos para secciones transversales, series de tiempo o datos de panel y los modelos comunes no lineales de microeconometría, como modelos logit, probit y tobit, hasta modelos semiparamétricos recientes. extensiones Además, proporciona un capítulo sobre programación, que incluye simulaciones, optimización y una introducción a las herramientas R que permite una investigación econométrica reproducible. Un paquete R que acompaña a este libro, AER, está disponible en la Red Integral de Archivos R (CRAN) en https://CRAN.R-project.org/package=AER .

 

Bibliografía

Yves Croissant, Giovanni Millo (2008). Econometría de datos de panel en R: El paquete de plm . Journal of Statistical Software 27 (2). URL www.jstatsoft.org/v27/i02/.

Marek Hlavac (2015). stargazer: Regresión con formato correcto y tablas de estadísticas de resumen . Paquete R versión 5.2. https://CRAN.R-project.org/package=stargazer

Christian Kleiber y Achim Zeileis (2008). Econometría Aplicada con R . Nueva York: Springer-Verlag. ISBN 978-0-387-77316-2. URL https://CRAN.R-project.org/package=AER

Franz Mohr (2015). prais: Prais-Winsten Procedimiento de estimación para AR (1) Correlación en serie . Versión del paquete R 0.1.1. https://CRAN.R-project.org/package=prais

R Core Team (2018). R: Un lenguaje y entorno para la informática estadística . R Foundation for Statistical Computing, Viena, Austria. URL https://www.R-project.org/ .

Hadley Wickham y Winston Chang (2016). devtools: herramientas para hacer que los paquetes R en desarrollo sean más fáciles . Paquete R versión 1.12.0. https://CRAN.R-project.org/package=devtools

Hadley Wickham. prueba de que: comience con las pruebas . Paquete R versión 1.0.2. https://CRAN.R-project.org/package=testthat

 

EL LIBRO DE WOOLDRIDGE, ES UN CLASICO. YA VAMOS EN LA 4ta. edición en español y la 6ta en inglés.

Jeffrey M. Wooldridge (2016). Econometría introductoria: un enfoque moderno . Mason, Ohio: South-Western Cengage Learning.

 

AGRADEZCO ESPECIALMENTE AL Dr. Yihui Xie,   por sus amables recomendaciones para mejorar este sitio. El Dr. Yihui Xie, actualmente trabaja en RStudio, Inc.

Yihui Xie (2018). knitr: Un paquete de propósito general para la Generación de informes dinámicos en I . Paquete R versión 1.16. https://CRAN.R-project.org/package=knitr

Guillermo Martínez Atilano