Encuesta Lonngitudinal de la Primera Infancia
ELPI
Presentación del caso
La Encuesta Lonngitudinal de la Primera Infancia fue diseñada para realizar un seguimiento periódico de una muestra de niños y niñas desde su nacimiento, con el objetivo de conocer sus trayectorias de vida y los factores que influyen en su desarrollo. En 2010, se seleccionó una muestra de 30,000 niños y niñas nacidos entre el 1 de enero de 2006 y el 31 de agosto de 2009, de los registros de nacimientos del Servicio de Registro Civil e Identificación, con el fin de obtener una muestra objetivo de 15,000. Esta muestra se eligió para ser representativa de todos los niños y niñas nacidos en ese período, asegurando representatividad por rango etario para las cohortes de 2006, 2007, 2008 y mediados de 2009. El diseño muestral utilizado fue estratificado por conglomerados, donde las comunas fueron seleccionadas como unidades de la primera etapa y los niños como variable de la segunda. En la primera etapa, se agruparon comunas con niveles socioeconómicos similares, y en la segunda se realizó un muestreo aleatorio sistemático de niños dentro de las comunas, distribuyendo la muestra de manera proporcional a la población de cada estrato en las 15 regiones del país.
Los instrumentos aplicados entre las primeras tres rondas del ELPI incluyeron cuestionarios aplicados al cuidador(a) principal, divididos en módulos referentes a la composición del hogar, educación, situación laboral, ingresos, previsión social, activos y patrimonio, y participación en programas sociales. Además, se incluyó una batería de instrumentos para evaluar el desarrollo psicomotor, socioemocional y antropométrico de los niños. Entre estos, el EEDP (Escala de Evaluación del Desarrollo Psicomotor) y el TEPSI (Test de Desarrollo Psicomotor) midieron habilidades motoras, cognitivas y de lenguaje en los menores. Por otro lado, el ASQ: SE (Ages & Stages Questionnaire: Social Emotional) y el CBCL1 (Child Behavior Checklist) evaluaron el desarrollo socioemocional, mientras que las medidas antropométricas (peso, talla, IMC, circunferencia craneal) permitieron monitorear la salud física. Para los cuidadores principales, se aplicaron subescalas de la WAIS (Wechsler Adults Intelligence Scale), que midieron aspectos cognitivos, y el Big Five Inventory (BFI), que evaluó dimensiones socioemocionales como la extraversión y responsabilidad. Estos instrumentos permitieron recolectar datos comprensivos sobre el desarrollo infantil en diversas áreas.
A partir de estos datos, es posible resolver preguntas relacionadas con el desarrollo infantil, el bienestar emocional y social, y las dinámicas familiares. Algunas preguntas que podrían explorarse son: ¿Cuál es la correlación entre el nivel educativo del cuidador(a) principal y el desarrollo cognitivo y psicomotor de los niños(as)? ¿Cómo afecta la participación en programas como “Chile Crece Contigo” al desarrollo emocional y conductual de los niños y niñas en comparación con aquellos que no participan? ¿Existen diferencias significativas en el desarrollo emocional y social de los niños y niñas que viven con ambos padres biológicos frente a aquellos que viven solo con uno de ellos o en hogares monoparentales? ¿Cómo influye el nivel de educación alcanzado por cuidador(a) principal en la salud mental y el desarrollo psicomotor de los niños(as)? Estas preguntas no solo podrían ayudar a entender mejor las dinámicas de desarrollo infantil en Chile, sino que también podrían informar la creación de políticas y programas de intervención orientados a mejorar el bienestar de los niños y sus familias.
Actividades
Clase 1
Modelo de datos
- Tendencia central y variabilidad
En la Encuesta Longitudinal de la Primera Infancia (ELPI) se recogen datos detallados sobre los ingresos familiares en los hogares con niños menores de 5 años. Estos datos nos permiten comprender cómo varían los ingresos entre los hogares y cómo se distribuyen en función de características socioeconómicas, como el número de miembros o la zona geográfica. Para analizar estos datos, partiremos calculando la media, la mediana, la desviación estándar y el rango de los ingresos per cápita. Estas medidas nos permiten analizar qué tan dispersos están los ingresos respecto a la media, lo cual es útil para entender la desigualdad económica entre los hogares. Finalmente, responde ¿Qué nos dicen las medidas de tendencia central y dispersión sobre la distribución de los ingresos en este caso?
Respuesta:
A través de estos datos, también podemos analizar cómo varían las puntuaciones de desarrollo entre los niños. En esta ocasión, nos enfocaremos en la variable de puntuación en el desarrollo psicomotor medido a través de la escala TEPSI, la cual permite conocer el nivel de desarrollo psicomotor de niños(as) entre dos y cinco años en relación a una norma estadística establecida por grupo de edad, y determinar si este rendimiento es normal (40 puntos T o más) o está bajo lo esperado (39 puntos T o menos). Al igual que en ejercicio anterior, calcula media, mediana, desviación estándar y rango de los puntajes T de los niños de la muestra, y responde: ¿Qué nos dicen las medidas de tendencia central y dispersión sobre la distribución de las puntuaciones y la variabilidad en el desarrollo de los niños?
Respuesta:
- Modelo nulo y residuos
En el análisis del desarrollo infantil, es común utilizar modelos estadísticos para predecir resultados, como el puntaje en el Test de Desarrollo Psicomotor (TEPSI). En este ejercicio, aplicaremos un modelo nulo (sin predictores) y evaluaremos los residuos, que nos permitirán observar las desviaciones de cada niño respecto a la media general. Para ello, formula un modelo nulo utilizando la media de los puntajes T que obtuviste anteriormente y calcula sus residuos. Luego, visualiza en un histograma la magnitud de los residuos para ver si hay grandes desviaciones de los puntajes observados respecto a la media predicha.
Clase 2
Modelo de regresión
- Regresión simple y sus parámetros
Hasta ahora, hemos obtenido información de dos variables por separado, el ingreso per cápita del hogar y el puntaje en el Test de Desarrollo Psicomotor (TEPSI). El análisis de regresión simple nos permitirá relacionarlas, estimando cómo cambia el puntaje TEPSI a medida que varía el ingreso familiar. Para ello, ajusta el modelo el para predecir el puntaje TEPSI (variable dependiente) a partir del ingreso per cápita (variable independiente). Posteriormente, obtén los resultados del modelo e interpreta los parámetros (pendiente e intersección) ¿Existe una relación entre el ingreso per cápita y los puntajes TEPSI? ¿Qué dirección tiene esta relación? ¿Cuál es la magnitud de esta relación?
Respuesta:
Caracterizando y comparando distribuciones
- Tendencia central, variabilidad y asimetría
Los quintiles de ingreso per cápita permiten dividir a los hogares en cinco grupos, desde los hogares con menor ingreso (primer quintil) hasta los hogares con mayor ingreso (quinto quintil). En este ejercicio, caracterizaremos y compararemos las distribuciones de los puntajes TEPSI de niños pertenecientes a diferentes quintiles de ingreso per cápita utilizando medidas de tendencia central, variabilidad y asimetría. Esto nos ayudará a entender cómo varían los puntajes TEPSI entre diferentes niveles socioeconómicos y qué implicaciones tienen estas diferencias en el desarrollo infantil. Para ello,
- Divide el ingreso per cápita en quintiles (Q1 a Q5) generando 5 distribuciones,
- calcula las medidas de tendencia central (media y mediana), variabilidad (desviación estándar y rango) y asimetría para cada una de estas.
- Visualiza las distribuciones de cada grupo utilizando histogramas y boxplots para identificar posibles diferencias.
- Finalmente, compara los resultados entre los cinco quintiles, y describe las diferencias observadas. Emplea un gráfico que permita ilustrar las diferencias descritas.
Respuesta:
Clase 3
Comparación de modelos
- Modelo base vs modelo de regresión y R2 como indicador de comparación de ajuste
A continuación compararemos los dos modelos que creaste anteriormente, aquel que predice el desarrollo psicomotor de los niños a partir del puntaje T promedio de la muestra (modelo base) y aquel que introduce el ingreso per cápita como variable predictora (modelo de regresión). Queremos saber cuánto mejora el ajuste del modelo al incluir el efecto de esta última variable. Para ello,
Calcula los componentes de varianza de ambos modelos para obtener el R² SST (Suma Total de Cuadrados): Calcula la variabilidad total en los puntajes TEPSI respecto a su media general. SSR (Suma de Cuadrados de la Regresión): Calcula la variabilidad explicada por el modelo. SSE (Suma de Cuadrados del Error): Calcula la variabilidad no explicada (error) Calcula el R² para cada modelo dividiendo el SSR por el SST. Esto nos permitirá saber qué proporción de la variabilidad en los puntajes TEPSI es explicada por el ingreso per cápita.
Realiza una prueba de ANOVA para comparar ambos modelos y verifica si el modelo que incluye el ingreso per cápita mejora significativamente el ajuste en comparación con el modelo base. La tabla de ANOVA mostrará los componentes de varianza para cada modelo y el estadístico F correspondiente. Este valor F sigue una distribución de probabilidad F utilizada para realizar pruebas de hipótesis sobre varianzas. En este caso, se emplea para comparar el ajuste de dos modelos mediante el análisis de varianza (ANOVA). La distribución F nos permite probar si la reducción en el error del modelo al incluir el ingreso per cápita como predictor es significativa o si podría haberse producido simplemente por azar.
Interpretación de Resultados: Observa los valores de R² para ambos modelos y determina qué proporción de la variabilidad en los puntajes TEPSI explica el ingreso per cápita. Interpreta el valor p del estadístico F en la tabla de ANOVA.
Respuesta:
La distribución normal
- Puntaje Z
En este ejercicio, analizaremos cómo se distribuye el desarrollo psicomotor de los niños según su quintil de ingreso utilizando el puntaje Z. Para ello, utilizando la media y desviación estándar que obtuviste previamente para cada grupo,
- calcula el puntaje Z del desarrollo psicomotor (puntaje T en TEPSI) de cada niño dentro de su propio quintil, lo que permitirá comparar el desempeño individual en relación con el promedio de su grupo socioeconómico.
- Luego, clasifica a los niños dentro de su quintil en tres grupos: por debajo del promedio (Z < 0), en promedio (Z = 0) y por encima del promedio (Z > 0).
- Finalmente, analiza las proporciones de niños en cada grupo y observa si existen tendencias entre los diferentes quintiles de ingreso.
Respuesta:
- Simulación de datos y muestras de una distribución normal
El Inventario de Desarrollo Battelle (BDI) es una herramienta utilizada para evaluar diversas áreas del desarrollo infantil, incluyendo: Personal/Social, Adaptativa, Motora, Comunicación y Cognitiva. A diferencia del TEPSI, que se aplica en niños de 2 a 5 años, el BDI se aplica en niños de entre 6 y 23 meses. En la Encuesta Longitudinal de la Primera Infancia (ELPI), se han obtenido puntajes BDI que muestran un promedio de 45.8 y una desviación estándar de 13.3. Basándote en estos valores,
simula dos muestras de 1,000 datos de puntajes BDI utilizando una distribución normal. Genera histogramas para visualizar las distribuciones de las dos muestras simuladas y superpone curvas de densidad para comparar las distribuciones.
Extrae una muestra aleatoria de 100 datos de cada una de las distribuciones simuladas y sus respectivos estadísticos descriptivos (media, desviación estándar, percentiles).
Calcula el sesgo de la media en cada muestra de 100 observaciones. Usa la fórmula: sesgo = 𝑥 − 𝜃.Donde 𝑥 es la media de la muestra de 100 observaciones y 𝜃 es el parámetro poblacional. Este cálculo permite evaluar cuánto se desvía la media muestral de 100 observaciones respecto al verdadero valor poblacional.
Finalmente, responde a las siguientes preguntas: ¿Qué diferencias observas en los histogramas de las dos muestras simuladas de puntajes BDI? Describe estas diferencias no solo en términos de su forma y dispersión, sino también considerando el sesgo de la media en cada muestra de 100 observaciones respecto al promedio poblacional. ¿Qué implicaciones podría tener el sesgo en la interpretación de cada muestra?
Respuesta:
Clase 4
Modelo de regresión y correlación
- Interpretando la pendiente y su estandarización y Correlación de Pearson
Retomando el análisis de regresión simple, exploraremos la relación entre el desarrollo psicomotor (ahora medido a través del puntaje BDI) y el ingreso per cápita del hogar. Utilizaremos tres estimados estadísticos clave: beta no estandarizado, beta estandarizado, y correlación de Pearson. El primero indica cuánto cambia el desarrollo psicomotor por cada unidad adicional de ingreso per cápita. Para obtener este valor, ajusta un modelo de regresión simple donde el ingreso per cápita sea la variable independiente y el puntaje del BDI sea la variable dependiente. Ejecuta el modelo de regresión y revisa la salida del modelo, donde el coeficiente del ingreso per cápita será el valor de beta no estandarizado.
El segundo, el beta estandarizado, permite medir la relación en términos de desviaciones estándar, lo cual facilita la comparación de la magnitud del efecto. Para obtener este valor, estandariza tanto el ingreso per cápita como el puntaje del BDI para que ambas variables tengan una media de 0 y una desviación estándar de 1. Luego, ajusta nuevamente el modelo de regresión con estas variables estandarizadas.
El tercero, la correlación de Pearson, te permitirá conocer la dirección y el tamaño de la relación entre el ingreso per cápita y el puntaje del BDI en términos de asociación lineal. Calcula la correlación de Pearson entre el ingreso per cápita estandarizado y el puntaje de BDI estandarizado.
Finalmente, compara los tres estimados (beta no estandarizado, beta estandarizado, y correlación de Pearson) para analizar si son consistentes en cuanto a la dirección de la relación. ¿Qué diferencias observas entre ellos? Discute en qué situaciones cada uno de estos estimados es útil y qué información adicional proporciona el beta no estandarizado en comparación con la correlación de Pearson.
Respuesta:
Clase 5
Distribuciones de datos y distribuciones de probabilidad
- Simulando distribuciones de datos
En este ejercicio, analizaremos cómo se puede ubicar un puntaje específico de TEPSI dentro de diferentes distribuciones (Normal, Uniforme y t de Student) para observar cómo varía su probabilidad de ocurrencia según la distribución empleada. Para ello,
Simula distribuciones con las siguientes características
Distribución Normal: Utiliza la media y desviación estándar reales de los puntajes TEPSI. Teniendo como puntaje TEPSI específico el valor 29 (valor a partir del cual se considera tener retraso en el desarrollo psicomotor) indica y calcula su posición y probabilidad acumulada dentro de esta distribución.
Distribución Uniforme: Usa el mínimo y máximo de los puntajes TEPSI para definir el rango. Calcula la posición del mismo puntaje específico dentro de esta distribución y su probabilidad de ocurrencia en función de la distribución uniforme.
Distribución t de Student: Calcula los grados de libertad como GL = 𝑛 − 1, donde 𝑛 es el tamaño de la muestra. Calcula la probabilidad asociada al puntaje específico dentro de esta distribución y su comparación con la probabilidad en las otras distribuciones.
Genera gráficos de densidad o histogramas para cada distribución simulada. Marca la posición del puntaje TEPSI seleccionado en cada gráfico para visualizar cómo cambia su probabilidad de ocurrencia según la distribución.
Responde ¿Qué diferencias observas en la posición y probabilidad del puntaje específico dentro de cada distribución? ¿Cómo influye la forma de cada distribución en la interpretación de la probabilidad asociada al puntaje? ¿Por qué la probabilidad de ocurrencia varía entre distribuciones para el mismo puntaje?
Respuesta:
- Expresando en probabilidades un resultado en una distribución de datos
A continuación, usarás la primera distribución simulada, en la que usaste la media y desviación estándar reales de los puntajes TEPSI para calcular la probabilidad de obtener un puntaje inferior a 29. Luego, compara los resultados de la simulación con los datos reales. ¿Cuál es la probabilidad de que un niño(a) obtenga un puntaje inferior a 29 en los puntajes TEPSI simulados y reales?
Respuesta:
- Distribuciones de probabilidad
Ahora queremos comparar los puntajes TEPSI entre dos grupos de niños(as) cuyos cuidadores están ocupados o desocupados utilizando las distribuciones de probabilidad t de Student y F. Para ello, divide los puntajes TEPSI en dos grupos según el estado ocupacional del cuidador, y calcula la media y varianza para cada grupo. Luego, aplica una prueba t para comparar las medias de los dos grupos y una prueba F para comparar las varianzas entre los grupos. Finalmente, responde ¿Existen diferencias significativas entre las medias y varianzas de los puntajes TEPSI para los grupos de cuidadores ocupados y desocupados?
Respuesta:
Clase 6
Distribuciones muestrales
- Simulación de muestras de un universo y distribución muestral del promedio
En este ejercicio, usarás los puntajes del CBCL (cuyo promedio obtenido fue 59,8 puntos y la desviación estándar 9,8) como el universo del cual se tomarán muestras. Simula 1,000 muestras de tamaño n = 30 y calcula el promedio de cada muestra. Finalmente, visualiza la distribución de los promedios muestrales en un histograma y responde ¿Cómo se distribuyen los promedios de las muestras simuladas? ¿Qué observas sobre la forma de la distribución?
Respuesta:
- El teorema del límite central y el efecto del tamaño muestral en la distribución muestral
Para observar cómo cambia la distribución muestral a medida que aumenta el tamaño de muestra, utiliza las simulaciones previas y agrega 1,000 muestras de tamaño n = 10, n = 50, y n = 100. Calcula el promedio y desviación estándar de cada muestra y visualiza en un histograma las distribuciones muestrales del promedio para cada tamaño muestral. Luego, compara los resultados: ¿Cómo cambia la distribución muestral del promedio conforme aumenta el tamaño de la muestra? ¿Qué sucede con la variabilidad de los promedios?
Respuesta:
- Intervalos de confianza
A continuación, construiremos intervalos de confianza para el promedio poblacional de los puntajes CBCL basados en las muestras simuladas. Para ello, elige una muestra simulada de tamaño n = 50 y calcula el promedio y el intervalo de confianza al 95%. Finalmente, responde ¿Qué significa el intervalo de confianza en términos de la estimación del promedio poblacional?
Respuesta:
Clase 7
La lógica del contraste de hipótesis en estadística con una media
- El modelo de regresión base, Hipótesis nula, Hipótesis alternativa y El valor p
Vuelve sobre el primer modelo que creaste para la clase 2, el modelo nulo. En este, utilizamos el promedio de los puntajes obtenidos en el TEPSI para predecir el puntaje individual de cada niño de la muestra. En cambio, el segundo modelo que ajustaste introduce, además, el ingreso per cápita del hogar como variable predictora. ¿Cuál es la hipótesis que este segundo modelo está tratando de probar? Y si la hipótesis nula es aquella que niega los efectos de la variable predictora postulada en la hipótesis alternativa ¿Cuál sería la hipótesis nula dentro de este contexto? Responde estas mismas preguntas para el modelo de regresión que creaste para predecir el nivel de desarrollo psicomotor medido a través del BDI.
Respuesta:
Calcula el valor p para el ingreso per cápita del hogar en cada modelo, este nos indicará si dicha variable tiene un impacto significativo en el nivel de desarrollo psicomotor de los niños de entre 6 y 23 meses, en el caso del BDI, y de entre 24 y 59 meses, en el caso del TEPSI. Finalmente, responde: ¿El valor p asociado al ingreso per cápita es menor a 0.05? Si es así, ¿qué podemos concluir sobre las hipótesis alternativas formuladas?
Respuesta:
Clase 8
Comparando medias de dos grupos I
- El modelo de regresión con predictor dicotómico
El Test de Vocabulario en Imágenes Peabody (TVIP) es una herramienta psicométrica diseñada para medir el vocabulario receptivo o auditivo de un individuo, evaluando su capacidad para entender palabras al escuchar su significado. Este ejercicio tiene como objetivo evaluar si el nivel educacional de la madre influye en el desarrollo del vocabulario receptivo de los niños, utilizando los puntajes de TVIP (Test de Vocabulario en Imágenes Peabody) como variable dependiente. Para ello,
Codifica el nivel educacional de la madre como una variable dicotómica: Baja escolaridad (0): Incluye las categorías Sin educación formal, Básica Incompleta, Básica Completa, y Media Incompleta. Alta escolaridad (1): Incluye Media Completa, Técnica Superior, y Universitaria.
Crea un modelo de regresión lineal donde la variable dependiente sea el puntaje de TVIP y la variable independiente sea la escolaridad de la madre (alta o baja). Visualiza los resultados utilizando un boxplot que compare los puntajes del TVIP entre ambos grupos.
Finalmente, interpreta los resultados del modelo: La pendiente del modelo indicará el cambio promedio en el puntaje de TVIP asociado a un cambio en el nivel de escolaridad de la madre (de baja a alta), mientras que el valor p asociado al predictor indicará si la escolaridad de la madre es un factor significativo para predecir el vocabulario receptivo de los niños.
Respuesta:
Clase 9
Comparando medias de dos grupos II
- Comparación con Prueba z
La lactancia materna ha sido asociada con beneficios en el desarrollo cognitivo de los niños (Anderson, Johnstone, & Remley, 1999; Mortensen, Michaelsen, Sanders, & Reinisch, 2002). En este ejercicio, compararemos los puntajes en el área cognitiva del Inventario de Desarrollo Battelle (BDI) entre los niños que fueron amamantados por la madre biológica y aquellos que no lo fueron. Para ello,
calcula la media y desviación estándar de los puntajes en el área cognitiva del BDI de cada grupo y realiza una prueba z, asumiendo que tenemos una muestra grande y que conocemos las desviaciones estándar de la población.
Luego, utiliza un boxplot para visualizar los resultados y evalúa si hay diferencias significativas entre los dos grupos.
Respuesta:
- Comparación con prueba t
El consumo de alcohol durante el embarazo puede tener efectos negativos en el desarrollo psicomotor de los niños. En este ejercicio, compararemos los resultados del Test de Desarrollo Psicomotor (TEPSI) entre los niños cuyas madres consumieron alcohol regularmente durante el embarazo y aquellos cuyas madres nunca consumieron alcohol durante el embarazo. Para ello,
asumiendo varianzas iguales, realiza una prueba t para comparar las medias de los puntajes TEPSI entre los dos grupos.
Finalmente, realiza un boxplot para visualizar los resultados y evalúa si hay diferencias significativas en el desarrollo psicomotor de cada condición.
Respuesta:
Ahora, vuelve a realizar una prueba t de dos muestras independientes para comparar los puntajes TEPSI entre las mismas dos condiciones del ejercicio anterior, pero esta vez sin asumir varianzas iguales. Visualiza los resultados utilizando un boxplot y, fíjate en cómo cambian los grados de libertad entre esta prueba y la del primer ejercicio (asumiendo varianzas iguales). Compara los resultados obtenidos en ambas pruebas y discute las diferencias: ¿Existen diferencias en los resultados entre la prueba t con varianzas iguales y la que no asume varianzas iguales? ¿Cómo afectan los grados de libertad a los resultados? ¿El modelo de regresión proporciona resultados consistentes con ambas pruebas t?
Respuesta:
- Comparación con ANOVA
A continuación, analizaremos cómo varían los puntajes del área cognitiva del Inventario de Desarrollo Battelle (BDI) entre los diferentes niveles educativos del cuidador principal (sin educación formal, básica incompleta, media completa, técnica superior, y universitaria). Para ello,
realiza un análisis ANOVA de un factor para comparar los puntajes del BDI entre los diferentes niveles educativos.
Posteriormente, interpreta los resultados del ANOVA y,
si hay diferencias significativas en los niveles de desarrollo cognitivo entre los grupos de nivel educativo del cuidador, realiza una prueba post-hoc de Tukey para identificar qué grupos específicos tienen diferencias significativas.
Visualiza estas diferencias utilizando un boxplot que represente las medias de desarrollo cognitivo para cada nivel educativo del cuidador.
Respuesta:
Clase 10
Comparando medias de tres o más grupos ll
- El modelo de regresión con un predictor politómico
Un cuidador con mayor nivel educativo podría tener acceso a mejores recursos y conocimientos que promuevan el aprendizaje y el desarrollo de los niños en un entorno enriquecedor. Este ejercicio tiene como objetivo analizar si existen diferencias en el desarrollo cognitivo y psicomotor de los niños en función del nivel educativo del cuidador(a) principal, para ello, utilizaremos los puntajes del BDI y la información sobre el nivel educativo alcanzado por los cuidadores principales del niño(a). Con estas variables,
- realiza un ANOVA que te permita comparar las medias del desarrollo cognitivo y psicomotor de los niños entre los diferentes niveles educativos del cuidador(a) principal.
- Si el resultado del ANOVA indica diferencias significativas, realiza una prueba post hoc (como la prueba de Tukey) para identificar diferencias específicas entre los niveles educativos.
- Finalmente, interpreta los resultados obtenidos a partir del análisis.
Respuesta:
- Dicotomizando una variable politómica
A continuación analizaremos cómo el nivel educacional de los padres y la composición familiar del hogar afectan el desarrollo cognitivo y psicomotor (evaluado por el BDI) de los niños. Para ello,
dicotomiza la variable politómica de la composición familiar del hogar (que originalmente contiene las opciones: ambos padres biológicos, madre biológica y padre adoptivo, madre biológica y padrastro, madre biológica, padre biológico, etc.) en hogar monoparental y hogar biparental.
Luego, realiza un ANOVA para comparar las medias entre los grupos e interpreta los resultados.
Si el resultado del ANOVA es significativo, realiza una prueba post hoc de Tukey para identificar qué grupos específicos tienen diferencias significativas.
Respuesta:
Clase 12
Regresión múltiple I
- Dos variables dicotómicas (e interacción)
El desarrollo psicomotor de los niños puede verse afectado por el consumo de sustancias durante el embarazo. Este ejercicio tiene como objetivo analizar si existe una relación entre el desarrollo psicomotor de los niños, medido por el Inventario de Desarrollo Battelle (BDI), y el consumo de cigarrillos y alcohol por parte de las madres durante el embarazo. Para ello,
- Dicotomiza las variables de consumo de cigarrillos y de alcohol, las cuales originalmente contienen las categorías “nunca”, “esporádicamente” y “regularmente”, en dos niveles:
- No consumo (0): que incluye sólo la primera categoría.
- Cualquier consumo (1): que incluye las otras dos.
crea un modelo de regresión múltiple que incluya las variables recodificadas de consumo de cigarrillos y consumo de alcohol, además de su interacción para predecir el desarrollo psicomotor (BDI).
Luego, evalúa los coeficientes de regresión y la significancia de las variables, incluyendo la interacción, y responde ¿Existen diferencias significativas en el desarrollo psicomotor de los niños según el consumo de cigarrillos y alcohol por parte de las madres durante el embarazo, y cómo interactúan estos dos factores en su efecto sobre el desarrollo psicomotor?
Respuesta:
- Covarianza, correlación de Pearson y matrices de correlaciones
El desarrollo socioemocional de los niños está influenciado por múltiples factores, y uno de ellos es el entorno familiar y, en particular, las características socioemocionales de los cuidadores principales. Para analizar esta relación, utilizaremos dos instrumentos: (1) el ASQ (Ages and Stages Questionnaires: Social Emotional), que evalúa el desarrollo socioemocional de los niños, midiendo factores como la regulación emocional, la interacción social y el comportamiento; y (2) el Big Five Inventory (BFI), que mide cinco dimensiones de la personalidad de los cuidadores: Neuroticismo, Extraversión, Apertura a la experiencia, Amabilidad, y Responsabilidad. Nuestro objetivo es responder a la pregunta ¿Qué dimensiones del Big Five Inventory (BFI) se correlacionan más fuertemente con el desarrollo socioemocional de los niños medido por el ASQ? Para ello,
calcula la covarianza entre los puntajes de desarrollo socioemocional de los niños (ASQ) y cada una de las cinco dimensiones del BFI.
Posteriormente, calcula la correlación de Pearson entre los puntajes del ASQ y las dimensiones del BFI.
Finalmente, genera una matriz de correlaciones entre ambas variables e interpreta los resultados respondiendo a la pregunta anterior.
Respuesta:
En el estudio, también se utilizaron dos subescalas del WAIS (Escala de Inteligencia para Adultos de Wechsler) para evaluar las capacidades cognitivas de los cuidadores: Vocabulario y Retención de Dígitos. Estos puntajes estandarizados permiten medir el nivel de inteligencia del cuidador en relación con su grupo etario. A continuación, responderemos a la pregunta: ¿El nivel cognitivo de los niños se correlaciona mejor con la subescala de Vocabulario o Retención de Dígitos del WAIS, o con ambas por igual? Para ello,
calcula la covarianza y correlación de Pearson, utilizando los puntajes del área cognitiva de los niños, medida por el BDI, y las subescalas del WAIS para los cuidadores.
Muestra las correlaciones generando una matriz y
determina si existe una correlación más fuerte entre el nivel cognitivo de los niños y una subescala del WAIS, o si ambas subescalas tienen una correlación similar.
Respuesta:
Clase 13
Regresión múltiple II
- Una variable cuantitativa y una dicotómica (e interacción)
Este ejercicio tiene como objetivo analizar el desarrollo cognitivo de los niños, medido por el Inventario de Desarrollo Battelle (BDI), en función del ingreso per cápita y la composición familiar. Para ello,
recodifica la composición familiar como una variable dicotómica (biparental vs. monoparental) y
crea un modelo de regresión múltiple que incluya estas variables y su interacción para predecir el desarrollo cognitivo (BDI).
Luego, evalúa los coeficientes de regresión y la significancia de los tres predictores (ingreso per cápita, composición familiar e interacción), ¿Existen diferencias significativas en el desarrollo cognitivo de los niños según el ingreso per cápita? ¿cómo afecta la composición familiar esta relación?
Respuesta:
Clase 14
Medidas de asociación de dos variables categóricas
- Chi-cuadrado
Por último, responderemos a la pregunta ¿Existe una asociación significativa entre el género del jefe de hogar y el quintil de ingresos familiares? Para ello,
construye una tabla que muestre la frecuencia de las diferentes combinaciones entre el género del jefe de hogar y el quintil de ingresos.
Luego, realiza la prueba de Chi-cuadrado para determinar si hay una asociación significativa entre las dos variables categóricas.
Finalmente, evalúa el valor p de la prueba y determina si existe una asociación significativa entre el género del jefe de hogar y el quintil de ingresos.
Respuesta: