Base de datos auto

Tablas de frecuencia con condicionales:  tabulate

Las tablas de frecuencia absoluta nos permiten contabilizar casos que cumplen con determinadas condiciones, Stata genera este tipo de tablas mediante diversas formas, una de ella es mediante el comando tabulate, en el mismo, tal como muestran los siguientes ejemplos, podemos además introducir filtros, condicionales, factores de expansión y las demás bondades de Stata .

* Tabla de frecuencia absoluta, relativa y relativa acumulada

. tabulate foreign

Car type | Freq. Percent Cum.
————+———————————–
Domestic | 52 70.27 70.27
Foreign | 22 29.73 100.00
————+———————————–
Total | 74 100.00

Especificándole dos variables, también podemos obtener una tabla de contingencia cruzada:

. tabulate mpg foreign

Mileage | Car type
(mpg) | Domestic Foreign | Total
———–+———————-+———-
12 | 2 0 | 2
14 | 5 1 | 6
15 | 2 0 | 2
16 | 4 0 | 4
17 | 2 2 | 4

41 | 0 1 | 1
———–+———————-+———-
Total | 52 22 | 74

También podemos introducir filtros o condicionales a nuestras tablas, esto resulta interesante cuando deseamos restringir nuestro análisis a solo un grupo especial de la población. El próximo comando muestra la tabla de frecuencias de las variables sólo para las observaciones que cumplen la expresión especificada después del if.

Tablas de estadísticos descriptivos

Los estadísticos descriptivos constituyen una de las primeras miradas brindada a nuestra base de datos, Utilizando las especificaciones de contenido, se obtiene la tabla, conteniendo la deviación y la media de los precios según el origen de producción de los coches.

. table foreign, contents (n price mean price sd price )

————————————————-
Car type | N(price) mean(price) sd(price)
———-+————————————–
Domestic | 52 6,072.4 3097.104
Foreign | 22 6,384.7 2621.915
————————————————-

“Añadiendo además la opción row (col), la tabla incluirá una fila (columna) adicional con los valores totales, para cada valor de las opciones que aparecen”.

table foreign, contents (n price mean price sd price ) row

————————————————-
Car type | N(price) mean(price) sd(price)
———-+————————————–
Domestic | 52 6,072.4 3097.104
Foreign | 22 6,384.7 2621.915
|
Total | 74 6,165.3 2949.496

Podemos también solicitar as estadísticas para diversas variables, pero también podemos obtener muchos otros estadísticos descriptivos (Gresia, 2012), como por ejemplo:

tabstat price length weight if foreign == 1, s(count min max mean sd cv sk p50 p50 p75 p90)

stats | price length weight
———+——————————
N | 22 22 22
min | 3748 142 1760
max | 12990 193 3420
mean | 6384.682 168.5455 2315.909
sd | 2621.915 13.68255 433.0035
cv | .4106571 .0811802 .1869691
skewness | 1.215236 .0809646 1.056582
p50 | 5759 170 2180
p50 | 5759 170 2180
p75 | 7140 175 2650
p90 | 9735 189 2830
—————————————-

También, se puede combinar summ con el comando tabulate para obtener un resumen de estadístico descriptivo de alguna variables según condiciones específicas.

tabulate foreign, summarize( price)

| Summary of Price
Car type | Mean Std. Dev. Freq.
————+————————————
Domestic | 6,072.423 3,097.104 52
Foreign | 6,384.682 2,621.915 22
————+————————————
Total | 6,165.257 2,949.496 74