Guía interactiva 5: Comparación de medias de tres o más grupos utilizando regresión

Instrucciones

  • Esta guía contiene una serie de ejercicios resueltos. En cada ejercicio, con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar tanto la función de cada código como los resultados que emergen de él.

  • Adicionalmente, debe incorporar junto a esta guía el registro de las preguntas y respuestas producto de las interacción con el modelo de lenguaje de inteligencia artificial, junto con la versión y el tipo de inteligencia artificial utilizada.

  • Durante el desarrollo de la guía NO DEBE MODIFICAR los códigos entregados. Asimismo, recuerde no alterar el formato de este documento y responder en los espacios asignados.

  • Usaremos datos recolectados por el Instituto Nacional de la Juventud a partir de su novena encuesta (2018), sobre la actitud de los jóvenes chilenos hacia distintos temas valóricos.

  • El archivo con los datos se llama:

base_injuv2018.csv
  • El contenido de estos datos incluye:
#-------------------------------------------------------------------
# contenido de los datos
#-------------------------------------------------------------------
 $ EDAD      : int  23 22 27 15 16 15 29... # Edades de 18 a 29 años
 $ SEXO      : int  2 1 1 1 2 1 1 2 1 2 ... # 1= mujer; 2= hombre
 $ NSE       : int  3 2 2 3 2 2 3 3 2 1 ... # 1= alto; 2= medio; 3= bajo
 $ matrimonio: int  4 2 3 3 3 4 3 1 1 2 ... # Acuerdo con "El matrimonio como una institución para toda la vida"

# Nota: en la variable 'matrimonio', mayor numero indica mayor acuerdo.

Ejercicio 1. Cargar datos de una población.

Para poder iniciar esta guía, abra estos datos, y guardelos en un objeto llamado datos_injuv. En este caso, solo debe ejecutar el código señalado a continuación.

datos_injuv <- read.csv("https://david-ti.github.io/introstats/data/base_injuv2018.csv")

Ejercicio 2.

A continuación se presenta un código empleado por una persona para el tratamiento de los datos de la base brindada. Con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar la función del código.

datos_injuv$edad_cat <- cut(datos_injuv$EDAD, 
                            breaks = c(-Inf, 19, 24, Inf), 
                            labels = c("Grupo A", "Grupo B", "Grupo C"))
  • Respuesta
    • Función del código:

Ejercicio 3. Obtener una submuestra

Para continuar con esta guía, cree una muestra de 500 casos y guárdela en un objeto llamado “submuestra_INJUV”. Utilice su RUT como set.seed() para que la muestra sea única.

set.seed(123456789)
submuestra_INJUV <- datos_injuv[sample(1:9700, 1000),]

Ejercicio 4.

A continuación se presenta un código empleado por una persona para poder extraer información de los datos de la base brindada. Con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar tanto la función del código como los resultados que emergen de él.

aggregate(matrimonio ~ edad_cat, data = submuestra_INJUV, mean, na.rm = TRUE)
  • Respuesta
    • Función del código:
  • Interpretación de los resultados:

Ejercicio 5.

A continuación se presenta un código empleado por una persona para el tratamiento de los datos de la base brindada. Con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar la función del código.

data_model <- submuestra_INJUV
data_model$grupo_a <- ifelse(data_model$edad_cat == 'Grupo A', 1, 0)
data_model$grupo_b <- ifelse(data_model$edad_cat == 'Grupo B', 1, 0)
data_model$grupo_c <- ifelse(data_model$edad_cat == 'Grupo C', 1, 0)
  • Respuesta
    • Función del código:

Ejercicio 6.

A continuación se presenta un código empleado por una persona para poder realizar un análisis. Con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar tanto la función del código como los resultados que emergen de él. Es importante que su interpretación de los resultados incorpore toda la información que puede ser extraída de los resultados brindados.

modelo01 <- lm(matrimonio ~ grupo_b + grupo_c, data = data_model)
summary(modelo01)
  • Respuesta
    • Función del código:
  • Interpretación de los resultados:

Ejercicio 7.

A continuación se presenta un código empleado por una persona para poder realizar un análisis. Con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar tanto la función del código como los resultados que emergen de él. Es importante que su interpretación de los resultados incorpore toda la información que puede ser extraída de los resultados brindados. ¿Cuál es la diferencia con el código anterior?

modelo02 <- lm(matrimonio ~ grupo_a + grupo_b, data = data_model)
summary(modelo02)
  • Respuesta
    • Función del código:
  • Interpretación de los resultados:
  • Diferencia:

Ejercicio 8.

A continuación se presenta un código empleado por una persona para poder realizar un análisis. Con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar tanto la función del código como los resultados que emergen de él. Es importante que su interpretación de los resultados incorpore toda la información que puede ser extraída de los resultados brindados. ¿Cuál es la diferencia con el código anterior?

modelo03 <- lm(matrimonio ~ -1 + grupo_a + grupo_c, data = data_model)
summary(modelo03)
  • Respuesta
    • Función del código:
  • Interpretación de los resultados:
  • Diferencia:

Ejercicio 9.

A continuación se presenta un código empleado por una persona para poder realizar un análisis. Con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe interpretar tanto la función del código como los resultados que emergen de él. Es importante que su interpretación de los resultados incorpore toda la información que puede ser extraída de los resultados brindados. ¿Cuál es la diferencia con el código anterior?

modelo04 <- aov(matrimonio ~ edad_cat, data = data_model)
summary(modelo04)
TukeyHSD(modelo04)
  • Respuesta
    • Función del código:
  • Interpretación de los resultados:
  • Diferencia: