tI.1 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-I.1.txt”, skip = 6, header = T)

View(t1.2)

y <- t1.2[,1]

x <- t1.2[,2]

modelo1.2 <- lm(y~x)

Table2.1 Descarga

Table 3.2 Descarga

t3.2 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.2.txt”, skip = 6, header = T)

View(t3.2)

y <- t3.2[,1]

x <- t3.2[,2]

Table 2.7 Descarga

t2.7 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-2.7.txt”, skip = 9, header = T)

View(t2.7)

y <- t2.7[,1]

x1 <- t2.7[,2]

x2 <- t2.7[,7]

modelo2.7 <- lm(y~x1 + x2)

Table 2.8 Descarga

t3.5.5 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.5.5.txt”, skip = 6, header = T)

Table 3.5.5 Descarga

t3.5.5 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.5.5.txt”, skip = 6, header = T)

Table 3.6 Descarga

t3.6 <- read.table(“https://dcsh.izt.uam.mx/proyectos/r/wp-content/uploads/2023/09/Table-3.6.txt”, skip = 8, header = T)

Introducción a la econometría, Wooldridge

Una explicación antes de comenzar.

Esta página contiene ejemplos de cada capítulo de Introducción a la Econometría : Un Enfoque Moderno, 4a edición de Jeffrey M. Wooldridge. Cada ejemplo ilustra cómo cargar los datos, construir modelos econométricos y calcular estimaciones con el programa R .

El sitio de recursos complementario al libro proporciona conjuntos de datos disponibles públicamente para Eviews, Excel, y el software comercial Stata, R es la opción de software libre.

Además, el uso de R al construir una base en el modelado econométrico introduce uno a las herramientas de software capaces de escalar con las demandas de los métodos modernos en computación estadística. En el Apéndice se citan fuentes adicionales sobre el uso de R para la econometría.

Los estudiantes nuevos tanto en econometría como en paquete R pueden considerar que la introducción a ambos es compleja. En particular, el proceso de carga y preparación de datos antes de construir el primer modelo econométrico resulta frustrante debido a que no es amigable el programa y cualquier error se constituye en una verdadera complicación. El paquete de datos wooldridge tiene como objetivo simplificar esta tarea. Contiene el conjunto de datos de Introducción a la Econometría : Un Enfoque Moderno, que se puede cargar con una simple llamada a la función data().

Lo primero es instalar y carga el paquete wooldridge con el comando install. Para aquellos familiarizados con Stata saben que contiene bases de datos precargadas y con el paquete. Pero con el uso regular de libros de texto, los autores ponen disponibles los datos no sólo en la forma regular a través de archivos indivuales. Ahora también se tiene la costrumbre de instalar directamente la biblioteca completa de bases de datos, en este caso los 111 archivos indivuales es cargan directamente con un sólo proceso.

install.packages("wooldridge")

library(wooldridge)

Capítulo 2: El modelo de regresión simple

Example 2.10: Una ecuación de salario de registro

l o g (w a g e) 1. = β 0 + β 1 e d u c

Cargue los wage1datos y revise la documentación.

data("wage1")
?wage1

Estos son datos de la Encuesta de Población Actual de 1976, recopilada por Henry Farber cuando él y Wooldridge fueron colegas en el MIT en 1988.

Estime una relación lineal entre el registro de salario y educación .

log_wage_model <- lm(lwage ~ educ, data = wage1)

Imprimir los resultados. Estoy usando el stargazerpaquete para imprimir los resultados del modelo en un formato limpio y fácil de leer. Ver la bibliografía para más información.


	Variable dependiente:

	lwage

educ	0.083 ^*** (0.008)
Constante	0.584 ^*** (0.097)

Observaciones	526
R ²	0.186
R ² ajustado	0.184
Residual Std. Error	0.480 (df = 524)
Estadística F	119.582 ^*** (df = 1; 524)

Nota:	p <0.1; p <0.05; p <0.01

Capítulo 3: Análisis de regresión múltiple: estimación

Example 3.2: Ecuación de salario por hora

l o g (w a g e) 1. = β 0 + β 1 e d u c + β 3 e x p e r + β 4 t e n u r e

Estime el modelo de regresión de la educación , la experiencia y la tenencia contra el registro (salario) . Los wage1datos aún deberían estar en su entorno de trabajo.

hourly_wage_model <- lm(lwage ~ educ + exper + tenure, data = wage1)

Imprima los coeficientes estimados del modelo:


	Variable dependiente:

	lwage

educ	0.092 ^*** (0.007)
exper	0.004 ^** (0.002)
tenencia	0.022 ^*** (0.003)
Constante	0.284 ^*** (0.104)

Observaciones	526
R ²	0.316
R ² ajustado	0.312
Residual Std. Error	0.441 (df = 522)
Estadística F	80.391 ^*** (df = 3; 522)

Nota:	p <0.1; p <0.05; p <0.01

Capítulo 4: Análisis de regresión múltiple: inferencia

Example 4.7 Efecto de la capacitación laboral sobre las tasas de desecho de la empresa

Cargue el jtrainconjunto de datos y si está utilizando R Studio, Viewel conjunto de datos.

data("jtrain")

De H. Holzer, R. Block, M. Cheatham y J. Knott (1993), ¿Los subsidios de capacitación son efectivos? The Michigan Experience , Industrial and Labour Relations Review 46, 625-636. Los autores amablemente proporcionaron los datos.

?jtrain
View(jtrain)

Cree un índice lógico, identificando qué observaciones ocurren en 1987 y son no-unión.

index <- jtrain$year == 1987 & jtrain$union == 0

A continuación, subconjunta los datos de jtrain por el nuevo índice. Esto devuelve un data.frame de jtraindatos de empresas no sindicalizadas para el año 1987.

jtrain_1987_nonunion <- jtrain[index, ]

Ahora cree el modelo lineal regresivo hrsemp(horas totales de capacitación / total de empleados capacitados), el lsales(registro de ventas anuales) y lemploy(el registro del número de empleados), en contra lscrap(el registro de la tasa de raspado).

l s c r a p = α + β 1 h r s e m p + β 2 l s a l e s + β 3 l e m p l o y

linear_model <- lm(lscrap ~ hrsemp + lsales + lemploy, data = jtrain_1987_nonunion)

Finalmente, imprima el diagnóstico estadístico de resumen completo del modelo.


	Variable dependiente:

	lscrap

hrsemp	-0.029 (0.023)
lsales	-0,962 ^** (0,453)
lemploy	0,761 ^* (0,407)
Constante	12.458 ^** (5.687)

Observaciones	29
R ²	0.262
R ² ajustado	0.174
Residual Std. Error	1.376 (df = 25)
Estadística F	2.965 ^* (df = 3; 25)

Nota:	p <0.1; p <0.05; p <0.01

Capítulo 5: Análisis de regresión múltiple: Asintóticos OLS

Example 5.3: Modelo económico del crimen

De J. Grogger (1991), Certeza vs. Severidad de castigo , Economic Inquiry 29, 297-309. El profesor Grogger amablemente proporcionó un subconjunto de los datos que utilizó en su artículo.

n a r r 86 = β 0 + β 1 p c n v + β 2 a v g s e n + β 3 t o t t i m e + β 4 p t i m e 86 + β 5 q e m p 86 + μ

$n a r r 86 :$ número de veces arrestado, 1986. $p c n v :$ $p c n v :$ $p c n v :$ $p c n v :$ $p c n v :$
$p c n v :$ proporción de detenciones previas que conducen a condenas $a v g s e n :$ $a v g s e n :$ $a v g s e n :$
$a v g s e n :$ oración promedio cumplida, duración en meses. $t o t t i m e :$ $t o t t i m e :$ $t o t t i m e :$ $t o t t i m e :$ $t o t t i m e :$ $t o t t i m e :$ $t o t t i m e :$ $t o t t i m e :$
$t o t t i m e :$ tiempo en prisión desde que cumplió 18 años, duración en meses. $p t i m e 86 :$ $p t i m e 86 :$ $p t i m e 86 :$ $p t i m e 86 :$ $p t i m e 86 :$ $p t i m e 86 :$ $p t i m e 86 :$
$p t i m e 86 :$ meses de prisión durante 1986. $q e m p 86 :$
$q e m p 86 :$ cuartos empleados, 1986.

Cargue el crime1conjunto de datos.

data("crime1")
?crime1

Estime el modelo.

restricted_model <- lm(narr86 ~ pcnv + ptime86 + qemp86, data = crime1)

Crea una nueva variable que restricted_model_ucontenga los residuos $\tilde{μ}$ $\tilde{μ}$ de la regresión anterior.

restricted_model_u <- restricted_model$residuals

A continuación, regresión pcnv, ptime86, qemp86, avgsen, y tottime, contra los residuos $\tilde{μ}$ $\tilde{μ}$ guardado en restricted_model_u.

μ ~ = β 1 p c n v + β 2 a v g s e n + β 3 t o t t i m e + β 4 p t i m e 86 + β 5 q e m p 86

LM_u_model <- lm(restricted_model_u ~ pcnv + ptime86 + qemp86 + avgsen + tottime, 
    data = crime1)
summary(LM_u_model)$r.square

## [1] 0.001493846

L M = 2, 725 (0.0015)

LM_test <- nobs(LM_u_model) * 0.0015
LM_test

## [1] 4.0875

qchisq(1 - 0.10, 2)

## [1] 4.60517

El p- valor es:

PAG (X 22 > 4.09) \approx 0.129

1-pchisq(LM_test, 2)

## [1] 0.129542

Capítulo 6: Regresión múltiple: otros problemas

Example 6.1: Efectos de la contaminación en los precios de la vivienda, estandarizados.

p r i c e = β 0 + β 1 n o x + β 2 c r i m e + β 3 r o o m s + β 4 re yo s t + β 5 s t r a t i o + μ

$p r i c e$ : precio medio de la vivienda.

$n o x$ : Concentración de óxido nitroso; partes por millón.

$c r i m e$ : número de crímenes reportados per capita.

$r o o m s$ : número promedio de habitaciones en casas en la comunidad.

$d i s t$ : distancia ponderada de la comunidad a 5 centros de empleo.

$s t r a t i o$ : proporción promedio de alumnos por maestro en las escuelas de la comunidad.

z p r i c e 1. = β 1 z n o x + β 2 z c r i m e + β 3 z r o o m s + β 4 z re yo s t + β 5 z s t r a t i o

Cargue los hprice2datos y vea la documentación.

data("hprice2")
?hprice2

Datos de Hedonic Housing Prices y Demand for Clean Air , por Harrison, D. y DLRubinfeld, Journal of Environmental Economics and Management 5, 81-102. Diego García, un ex Ph.D. estudiante de economía en el MIT, amablemente proporcionó estos datos, que obtuvo del libro Regression Diagnostics: Identifying Influential Data and Sources of Collinearity, por DA Belsey, E. Kuh, y R. Welsch, 1990. Nueva York: Wiley.

Estime el coeficiente con el lmmodelo de regresión habitual , pero esta vez, coeficientes estandarizados envolviendo cada variable con la scalefunción de R :

housing_standard <- lm(scale(price) ~ 0 + scale(nox) + scale(crime) + scale(rooms) + 
    scale(dist) + scale(stratio), data = hprice2)


	Variable dependiente:

	escala (precio)

escala (nox)	-0.340 ^*** (0.044)
escala (crimen)	-0.143 ^*** ( 0.031 )
escala (habitaciones)	0.514 ^*** (0.030)
escala (dist)	-0.235 ^*** (0.043)
escala (stratio)	-0.270 ^*** (0.030)

Observaciones	506
R ²	0.636
R ² ajustado	0.632
Residual Std. Error	0.606 (df = 501)
Estadística F	174.822 ^*** (df = 5; 501)

Nota:	p <0.1; p <0.05; p <0.01

Example 6.2: Efectos de la contaminación en los precios de la vivienda, término interactivo cuadrático

Modificar el modelo de vivienda, agregando un término cuadrático en las habitaciones :

l o g (p r i c e) = β 0 + β 1 l o g (n o x) + β 2 l o g (d i s t) + β 3 r o o m s + β 4 r o o m s 2 + β 5 s t r a t i o + μ

housing_interactive <- lm(lprice ~ lnox + log(dist) + rooms+I(rooms^2) + stratio, data = hprice2)

Compare los resultados con el modelo de example 6.1.


	Variable dependiente:

	escala (precio)	lprice
	(1)	(2)

escala (nox)	-0.340 ^*** (0.044)
escala (crimen)	-0.143 ^*** ( 0.031 )
escala (habitaciones)	0.514 ^*** (0.030)
escala (dist)	-0.235 ^*** (0.043)
escala (stratio)	-0.270 ^*** (0.030)
lnox		-0.902 ^*** ( 0.115 )
log (dist)		-0.087 ^** (0.043)
habitaciones		-0.545 ^*** (0.165)
Yo (habitaciones2)		0.062 ^*** (0.013)
stratio		-0.048 ^*** (0.006)
Constante		13.385 ^*** (0.566)

Observaciones	506	506
R ²	0.636	0.603
R ² ajustado	0.632	0.599
Residual Std. Error	0.606 (df = 501)	0,259 (df = 500)
Estadística F	174.822 ^*** (df = 5; 501)	151.770 ^*** (df = 5; 500)

Nota:	p <0.1; p <0.05; p <0.01

	0.587
Residual Std. Error	1.843 (df = 53)
Estadística F	40.094 ^*** (df = 2; 53)

Nota:	p <0.1; p <0.05; p <0.01

Example 10.11: Efectos estacionales de las presentaciones antidumping

CM Krupp y PS Pollard (1999), Las respuestas del mercado a las leyes antidumping: algunas pruebas de la industria química de los Estados Unidos , Canadian Journal of Economics 29, 199-227. El Dr. Krupp amablemente proporcionó los datos. Son datos mensuales que abarcan desde febrero de 1978 hasta diciembre de 1988.

data("barium")
?barium

barium_imports <- lm(lchnimp ~ lchempi + lgas + lrtwex + befile6 + affile6 + 
    afdec6, data = barium)

Estime un nuevo modelo, barium_seasonalque tenga en cuenta la estacionalidad mediante la adición de variables ficticias contenidas en los datos. Calcule el anovaentre los dos modelos.

barium_seasonal <- lm(lchnimp ~ lchempi + lgas + lrtwex + befile6 + affile6 + 
    afdec6 + feb + mar + apr + may + jun + jul + aug + sep + oct + nov + dec, 
    data = barium)
barium_anova <- anova(barium_imports, barium_seasonal)


	Variable dependiente:

	lchnimp
	(1)	(2)

lchempi	3.117 ^*** (0.479)	3.265 ^*** (0.493)
lgas	0.196 (0.907)	-1.278 (1.389)
lrtwex	0,983 ^** (0,400)	0,663 (0,471)
befile6	0.060 (0.261)	0.140 (0.267)
affile6	-0.032 (0.264)	0.013 (0.279)
afdec6	-0.565 ^* (0.286)	-0.521 ^* (0.302)
feb		-0.418 (0.304)
mar		0.059 (0.265)
abr		-0.451 ^* (0.268)
mayo		0.033 (0.269)
jun		-0.206 (0.269)
jul		0.004 (0.279)
ago		-0.157 (0.278)
sep		-0.134 (0.268)
oct		0.052 (0.267)
nov		-0.246 (0.263)
dic		0.133 (0.271)
Constante	-17.803 (21.045)	16.779 (32.429)

Observaciones	131	131
R ²	0.305	0.358
R ² ajustado	0.271	0.262
Residual Std. Error	0.597 (df = 124)	0.601 (df = 113)
Estadística F	9.064 ^*** (df = 6; 124)	3.712 ^*** (df = 17; 113)

Nota:	p <0.1; p <0.05; p <0.01


Estadística	norte	Media	St. Dev.	Min.	Max

Res.Df	2	118.500	7.778	113	124
RSS	2	42.545	2.406	40.844	44.247
Df	1	11,000		11	11
Suma de Sq	1	3.403		3.403	3.403
F	1	0.856		0.856	0.856
Pr (> F)	1	0.585		0.585	0.585

Econometría Aplicada con R

es mi proyecto registrado en el Consejo Divisional de la DCSH.

Este proyecto presenta los métodos de la econometría aplicada que utiliza el sistema R para computación y gráficos estadísticos. Presenta ejemplos prácticos para una amplia gama de modelos econométricos, desde modelos de regresión lineal clásicos para secciones transversales, series de tiempo o datos de panel y los modelos comunes no lineales de microeconometría, como modelos logit, probit y tobit, hasta modelos semiparamétricos recientes. extensiones Además, proporciona un capítulo sobre programación, que incluye simulaciones, optimización y una introducción a las herramientas R que permite una investigación econométrica reproducible. Un paquete R que acompaña a este libro, AER, está disponible en la Red Integral de Archivos R (CRAN) en https://CRAN.R-project.org/package=AER .

Bibliografía

Yves Croissant, Giovanni Millo (2008). Econometría de datos de panel en R: El paquete de plm . Journal of Statistical Software 27 (2). URL www.jstatsoft.org/v27/i02/.

Marek Hlavac (2015). stargazer: Regresión con formato correcto y tablas de estadísticas de resumen . Paquete R versión 5.2. https://CRAN.R-project.org/package=stargazer

Christian Kleiber y Achim Zeileis (2008). Econometría Aplicada con R . Nueva York: Springer-Verlag. ISBN 978-0-387-77316-2. URL https://CRAN.R-project.org/package=AER

Franz Mohr (2015). prais: Prais-Winsten Procedimiento de estimación para AR (1) Correlación en serie . Versión del paquete R 0.1.1. https://CRAN.R-project.org/package=prais

R Core Team (2018). R: Un lenguaje y entorno para la informática estadística . R Foundation for Statistical Computing, Viena, Austria. URL https://www.R-project.org/ .

Hadley Wickham y Winston Chang (2016). devtools: herramientas para hacer que los paquetes R en desarrollo sean más fáciles . Paquete R versión 1.12.0. https://CRAN.R-project.org/package=devtools

Hadley Wickham. prueba de que: comience con las pruebas . Paquete R versión 1.0.2. https://CRAN.R-project.org/package=testthat

EL LIBRO DE WOOLDRIDGE, ES UN CLASICO. YA VAMOS EN LA 4ta. edición en español y la 6ta en inglés.

Jeffrey M. Wooldridge (2016). Econometría introductoria: un enfoque moderno . Mason, Ohio: South-Western Cengage Learning.

AGRADEZCO ESPECIALMENTE AL Dr. Yihui Xie, por sus amables recomendaciones para mejorar este sitio. El Dr. Yihui Xie, actualmente trabaja en RStudio, Inc.

Yihui Xie (2018). knitr: Un paquete de propósito general para la Generación de informes dinámicos en I . Paquete R versión 1.16. https://CRAN.R-project.org/package=knitr

Proyecto R

Datasets para R