tI.1 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-I.1.txt”, skip = 6, header = T)
View(t1.2)
y <- t1.2[,1]
x <- t1.2[,2]
modelo1.2 <- lm(y~x)
t3.2 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.2.txt”, skip = 6, header = T)
View(t3.2)
y <- t3.2[,1]
x <- t3.2[,2]
t2.7 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-2.7.txt”, skip = 9, header = T)
View(t2.7)
y <- t2.7[,1]
x1 <- t2.7[,2]
x2 <- t2.7[,7]
modelo2.7 <- lm(y~x1 + x2)
t3.5.5 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.5.5.txt”, skip = 6, header = T)
t3.5.5 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.5.5.txt”, skip = 6, header = T)
t3.6 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.6.txt”, skip = 8, header = T)
Introducción a la econometría, Wooldridge
Una explicación antes de comenzar.
Esta página contiene ejemplos de cada capítulo de Introducción a la Econometría : Un Enfoque Moderno, 4a edición de Jeffrey M. Wooldridge. Cada ejemplo ilustra cómo cargar los datos, construir modelos econométricos y calcular estimaciones con el programa R .
El sitio de recursos complementario al libro proporciona conjuntos de datos disponibles públicamente para Eviews, Excel, y el software comercial Stata, R es la opción de software libre.
Además, el uso de R al construir una base en el modelado econométrico introduce uno a las herramientas de software capaces de escalar con las demandas de los métodos modernos en computación estadística. En el Apéndice se citan fuentes adicionales sobre el uso de R para la econometría.
Los estudiantes nuevos tanto en econometría como en paquete R pueden considerar que la introducción a ambos es compleja. En particular, el proceso de carga y preparación de datos antes de construir el primer modelo econométrico resulta frustrante debido a que no es amigable el programa y cualquier error se constituye en una verdadera complicación. El
paquete de datos wooldridge
tiene como objetivo simplificar esta tarea. Contiene el conjunto de datos de Introducción a la Econometría : Un Enfoque Moderno, que se puede cargar con una simple llamada a la función data()
.
Lo primero es instalar y carga el paquete wooldridge con el comando install
. Para aquellos familiarizados con Stata saben que contiene bases de datos precargadas y con el paquete. Pero con el uso regular de libros de texto, los autores ponen disponibles los datos no sólo en la forma regular a través de archivos indivuales. Ahora también se tiene la costrumbre de instalar directamente la biblioteca completa de bases de datos, en este caso los 111 archivos indivuales es cargan directamente con un sólo proceso.
install.packages("wooldridge")
library(wooldridge)
Capítulo 2: El modelo de regresión simple
Example 2.10:
Una ecuación de salario de registro
Cargue los wage1
datos y revise la documentación.
data("wage1")
?wage1
Estos son datos de la Encuesta de Población Actual de 1976, recopilada por Henry Farber cuando él y Wooldridge fueron colegas en el MIT en 1988.
Estime una relación lineal entre el registro de salario y educación .
log_wage_model <- lm(lwage ~ educ, data = wage1)
Imprimir los resultados. Estoy usando el stargazer
paquete para imprimir los resultados del modelo en un formato limpio y fácil de leer. Ver la bibliografía para más información.
Variable dependiente: | |
lwage | |
educ | 0.083 *** (0.008) |
Constante | 0.584 *** (0.097) |
Observaciones | 526 |
R 2 | 0.186 |
R 2 ajustado | 0.184 |
Residual Std. Error | 0.480 (df = 524) |
Estadística F | 119.582 *** (df = 1; 524) |
Nota: | p <0.1; p <0.05; p <0.01 |
Capítulo 3: Análisis de regresión múltiple: estimación
Example 3.2:
Ecuación de salario por hora
Estime el modelo de regresión de la educación , la experiencia y la tenencia contra el registro (salario) . Los wage1
datos aún deberían estar en su entorno de trabajo.
hourly_wage_model <- lm(lwage ~ educ + exper + tenure, data = wage1)
Imprima los coeficientes estimados del modelo:
Variable dependiente: | |
lwage | |
educ | 0.092 *** (0.007) |
exper | 0.004 ** (0.002) |
tenencia | 0.022 *** (0.003) |
Constante | 0.284 *** (0.104) |
Observaciones | 526 |
R 2 | 0.316 |
R 2 ajustado | 0.312 |
Residual Std. Error | 0.441 (df = 522) |
Estadística F | 80.391 *** (df = 3; 522) |
Nota: | p <0.1; p <0.05; p <0.01 |
Capítulo 4: Análisis de regresión múltiple: inferencia
Example 4.7
Efecto de la capacitación laboral sobre las tasas de desecho de la empresa
Cargue el jtrain
conjunto de datos y si está utilizando R Studio, View
el conjunto de datos.
data("jtrain")
De H. Holzer, R. Block, M. Cheatham y J. Knott (1993), ¿Los subsidios de capacitación son efectivos? The Michigan Experience , Industrial and Labour Relations Review 46, 625-636. Los autores amablemente proporcionaron los datos.
?jtrain
View(jtrain)
Cree un índice lógico, identificando qué observaciones ocurren en 1987 y son no-unión.
index <- jtrain$year == 1987 & jtrain$union == 0
A continuación, subconjunta los datos de jtrain por el nuevo índice. Esto devuelve un data.frame de jtrain
datos de empresas no sindicalizadas para el año 1987.
jtrain_1987_nonunion <- jtrain[index, ]
Ahora cree el modelo lineal regresivo hrsemp
(horas totales de capacitación / total de empleados capacitados), el lsales
(registro de ventas anuales) y lemploy
(el registro del número de empleados), en contra lscrap
(el registro de la tasa de raspado).
linear_model <- lm(lscrap ~ hrsemp + lsales + lemploy, data = jtrain_1987_nonunion)
Finalmente, imprima el diagnóstico estadístico de resumen completo del modelo.
Variable dependiente: | |
lscrap | |
hrsemp | -0.029 (0.023) |
lsales | -0,962 ** (0,453) |
lemploy | 0,761 * (0,407) |
Constante | 12.458 ** (5.687) |
Observaciones | 29 |
R 2 | 0.262 |
R 2 ajustado | 0.174 |
Residual Std. Error | 1.376 (df = 25) |
Estadística F | 2.965 * (df = 3; 25) |
Nota: | p <0.1; p <0.05; p <0.01 |
Capítulo 5: Análisis de regresión múltiple: Asintóticos OLS
Example 5.3:
Modelo económico del crimen
De J. Grogger (1991), Certeza vs. Severidad de castigo , Economic Inquiry 29, 297-309. El profesor Grogger amablemente proporcionó un subconjunto de los datos que utilizó en su artículo.
n a r r 86 :norteunrr86:número de veces arrestado, 1986. pcnv:
pagdonortev:proporción de detenciones previas que conducen a condenas avg
s e n :unvgramosminorte:oración promedio cumplida, duración en meses. tottime:
tottyometromi:tiempo en prisión desde que cumplió 18 años, duración en meses. ptime86:
pagtyometromi86:meses de prisión durante 1986. q
e m p 86 :qmimetropag86: cuartos empleados, 1986.
Cargue el crime1
conjunto de datos.
data("crime1")
?crime1
Estime el modelo.
restricted_model <- lm(narr86 ~ pcnv + ptime86 + qemp86, data = crime1)
Crea una nueva variable que restricted_model_u
contenga los residuos μ~μ~ de la regresión anterior.
restricted_model_u <- restricted_model$residuals
A continuación, regresión pcnv, ptime86, qemp86, avgsen
, y tottime
, contra los residuos μ~μ~guardado en restricted_model_u
.
LM_u_model <- lm(restricted_model_u ~ pcnv + ptime86 + qemp86 + avgsen + tottime,
data = crime1)
summary(LM_u_model)$r.square
## [1] 0.001493846
LM_test <- nobs(LM_u_model) * 0.0015
LM_test
## [1] 4.0875
qchisq(1 - 0.10, 2)
## [1] 4.60517
El p- valor es:
1-pchisq(LM_test, 2)
## [1] 0.129542
Capítulo 6: Regresión múltiple: otros problemas
Example 6.1:
Efectos de la contaminación en los precios de la vivienda, estandarizados.
p r i c epagryodomi: precio medio de la vivienda.
n o xnorteoX: Concentración de óxido nitroso; partes por millón.
c r i m edoryometromi: número de crímenes reportados per capita.
r o o m sroometros: número promedio de habitaciones en casas en la comunidad.
rei s treyost: distancia ponderada de la comunidad a 5 centros de empleo.
s t r a t i ostruntyoo: proporción promedio de alumnos por maestro en las escuelas de la comunidad.
Cargue los hprice2
datos y vea la documentación.
data("hprice2")
?hprice2
Datos de Hedonic Housing Prices y Demand for Clean Air , por Harrison, D. y DLRubinfeld, Journal of Environmental Economics and Management 5, 81-102. Diego García, un ex Ph.D. estudiante de economía en el MIT, amablemente proporcionó estos datos, que obtuvo del libro Regression Diagnostics: Identifying Influential Data and Sources of Collinearity, por DA Belsey, E. Kuh, y R. Welsch, 1990. Nueva York: Wiley.
Estime el coeficiente con el lm
modelo de regresión habitual , pero esta vez, coeficientes estandarizados envolviendo cada variable con la scale
función de R :
housing_standard <- lm(scale(price) ~ 0 + scale(nox) + scale(crime) + scale(rooms) +
scale(dist) + scale(stratio), data = hprice2)
Variable dependiente: | |
escala (precio) | |
escala (nox) | -0.340 *** (0.044) |
escala (crimen) | -0.143 *** ( 0.031 ) |
escala (habitaciones) | 0.514 *** (0.030) |
escala (dist) | -0.235 *** (0.043) |
escala (stratio) | -0.270 *** (0.030) |
Observaciones | 506 |
R 2 | 0.636 |
R 2 ajustado | 0.632 |
Residual Std. Error | 0.606 (df = 501) |
Estadística F | 174.822 *** (df = 5; 501) |
Nota: | p <0.1; p <0.05; p <0.01 |
Example 6.2:
Efectos de la contaminación en los precios de la vivienda, término interactivo cuadrático
Modificar el modelo de vivienda, agregando un término cuadrático en las habitaciones :
housing_interactive <- lm(lprice ~ lnox + log(dist) + rooms+I(rooms^2) + stratio, data = hprice2)
Compare los resultados con el modelo de example 6.1
.
Variable dependiente: | ||
escala (precio) | lprice | |
(1) | (2) | |
escala (nox) | -0.340 *** (0.044) | |
escala (crimen) | -0.143 *** ( 0.031 ) | |
escala (habitaciones) | 0.514 *** (0.030) | |
escala (dist) | -0.235 *** (0.043) | |
escala (stratio) | -0.270 *** (0.030) | |
lnox | -0.902 *** ( 0.115 ) | |
log (dist) | -0.087 ** (0.043) | |
habitaciones | -0.545 *** (0.165) | |
Yo (habitaciones2) | 0.062 *** (0.013) | |
stratio | -0.048 *** (0.006) | |
Constante | 13.385 *** (0.566) | |
Observaciones | 506 | 506 |
R 2 | 0.636 | 0.603 |
R 2 ajustado | 0.632 | 0.599 |
Residual Std. Error | 0.606 (df = 501) | 0,259 (df = 500) |
Estadística F | 174.822 *** (df = 5; 501) | 151.770 *** (df = 5; 500) |
Nota: | p <0.1; p <0.05; p <0.01 |
0.587 | |
Residual Std. Error | 1.843 (df = 53) |
Estadística F | 40.094 *** (df = 2; 53) |
Nota: | p <0.1; p <0.05; p <0.01 |
Example 10.11:
Efectos estacionales de las presentaciones antidumping
CM Krupp y PS Pollard (1999), Las respuestas del mercado a las leyes antidumping: algunas pruebas de la industria química de los Estados Unidos , Canadian Journal of Economics 29, 199-227. El Dr. Krupp amablemente proporcionó los datos. Son datos mensuales que abarcan desde febrero de 1978 hasta diciembre de 1988.
data("barium")
?barium
barium_imports <- lm(lchnimp ~ lchempi + lgas + lrtwex + befile6 + affile6 +
afdec6, data = barium)
Estime un nuevo modelo, barium_seasonal
que tenga en cuenta la estacionalidad mediante la adición de variables ficticias contenidas en los datos. Calcule el anova
entre los dos modelos.
barium_seasonal <- lm(lchnimp ~ lchempi + lgas + lrtwex + befile6 + affile6 +
afdec6 + feb + mar + apr + may + jun + jul + aug + sep + oct + nov + dec,
data = barium)
barium_anova <- anova(barium_imports, barium_seasonal)
Variable dependiente: | ||
lchnimp | ||
(1) | (2) | |
lchempi | 3.117 *** (0.479) | 3.265 *** (0.493) |
lgas | 0.196 (0.907) | -1.278 (1.389) |
lrtwex | 0,983 ** (0,400) | 0,663 (0,471) |
befile6 | 0.060 (0.261) | 0.140 (0.267) |
affile6 | -0.032 (0.264) | 0.013 (0.279) |
afdec6 | -0.565 * (0.286) | -0.521 * (0.302) |
feb | -0.418 (0.304) | |
mar | 0.059 (0.265) | |
abr | -0.451 * (0.268) | |
mayo | 0.033 (0.269) | |
jun | -0.206 (0.269) | |
jul | 0.004 (0.279) | |
ago | -0.157 (0.278) | |
sep | -0.134 (0.268) | |
oct | 0.052 (0.267) | |
nov | -0.246 (0.263) | |
dic | 0.133 (0.271) | |
Constante | -17.803 (21.045) | 16.779 (32.429) |
Observaciones | 131 | 131 |
R 2 | 0.305 | 0.358 |
R 2 ajustado | 0.271 | 0.262 |
Residual Std. Error | 0.597 (df = 124) | 0.601 (df = 113) |
Estadística F | 9.064 *** (df = 6; 124) | 3.712 *** (df = 17; 113) |
Nota: | p <0.1; p <0.05; p <0.01 |
Estadística | norte | Media | St. Dev. | Min. | Max |
Res.Df | 2 | 118.500 | 7.778 | 113 | 124 |
RSS | 2 | 42.545 | 2.406 | 40.844 | 44.247 |
Df | 1 | 11,000 | 11 | 11 | |
Suma de Sq | 1 | 3.403 | 3.403 | 3.403 | |
F | 1 | 0.856 | 0.856 | 0.856 | |
Pr (> F) | 1 | 0.585 | 0.585 | 0.585 | |
Econometría Aplicada con R
es mi proyecto registrado en el Consejo Divisional de la DCSH.
Este proyecto presenta los métodos de la econometría aplicada que utiliza el sistema R para computación y gráficos estadísticos. Presenta ejemplos prácticos para una amplia gama de modelos econométricos, desde modelos de regresión lineal clásicos para secciones transversales, series de tiempo o datos de panel y los modelos comunes no lineales de microeconometría, como modelos logit, probit y tobit, hasta modelos semiparamétricos recientes. extensiones Además, proporciona un capítulo sobre programación, que incluye simulaciones, optimización y una introducción a las herramientas R que permite una investigación econométrica reproducible. Un paquete R que acompaña a este libro, AER, está disponible en la Red Integral de Archivos R (CRAN) en https://CRAN.R-project.org/package=AER .
Bibliografía
Yves Croissant, Giovanni Millo (2008). Econometría de datos de panel en R: El paquete de plm . Journal of Statistical Software 27 (2). URL www.jstatsoft.org/v27/i02/.
Marek Hlavac (2015). stargazer: Regresión con formato correcto y tablas de estadísticas de resumen . Paquete R versión 5.2. https://CRAN.R-project.org/package=stargazer
Christian Kleiber y Achim Zeileis (2008). Econometría Aplicada con R . Nueva York: Springer-Verlag. ISBN 978-0-387-77316-2. URL https://CRAN.R-project.org/package=AER
Franz Mohr (2015). prais: Prais-Winsten Procedimiento de estimación para AR (1) Correlación en serie . Versión del paquete R 0.1.1. https://CRAN.R-project.org/package=prais
R Core Team (2018). R: Un lenguaje y entorno para la informática estadística . R Foundation for Statistical Computing, Viena, Austria. URL https://www.R-project.org/ .
Hadley Wickham y Winston Chang (2016). devtools: herramientas para hacer que los paquetes R en desarrollo sean más fáciles . Paquete R versión 1.12.0. https://CRAN.R-project.org/package=devtools
Hadley Wickham. prueba de que: comience con las pruebas . Paquete R versión 1.0.2. https://CRAN.R-project.org/package=testthat
EL LIBRO DE WOOLDRIDGE, ES UN CLASICO. YA VAMOS EN LA 4ta. edición en español y la 6ta en inglés.
Jeffrey M. Wooldridge (2016). Econometría introductoria: un enfoque moderno . Mason, Ohio: South-Western Cengage Learning.
AGRADEZCO ESPECIALMENTE AL Dr. Yihui Xie, por sus amables recomendaciones para mejorar este sitio. El Dr. Yihui Xie, actualmente trabaja en RStudio, Inc.
Yihui Xie (2018). knitr: Un paquete de propósito general para la Generación de informes dinámicos en I . Paquete R versión 1.16. https://CRAN.R-project.org/package=knitr