Modelo de regresión y correlación
- Interpretando la pendiente y su estandarización y Correlación de Pearson
Retomando el análisis de regresión simple, exploraremos la relación entre los niveles de soledad y el PSMU, pero esta vez usando la soledad como variable predictora y el PSMU como variable respuesta. Utilizaremos tres estimados estadísticos clave: beta no estandarizado, beta estandarizado, y correlación de Pearson. El primero indica cuánto cambia el PSMU por cada unidad adicional en el puntaje de soledad. Para obtener este valor, ajusta el modelo de regresión con las modificaciones correspondientes. Ejecuta el modelo de regresión y revisa la salida del modelo, donde el coeficiente del nivel de soledad será el valor de beta no estandarizado.
El segundo, el beta estandarizado, permite medir la relación en términos de desviaciones estándar, lo cual facilita la comparación de la magnitud del efecto. Para obtener este valor, estandariza tanto los puntajes de soledad como el puntaje de PSMU para que ambas variables tengan una media de 0 y una desviación estándar de 1. Luego, ajusta nuevamente el modelo de regresión con estas variables estandarizadas.
El tercero, la correlación de Pearson, te permitirá conocer la dirección y el tamaño de la relación entre la soledad y el PSMU en términos de asociación lineal. Calcula la correlación de Pearson entre ambas variables estandarizadas.
Finalmente, compara los tres estimados (beta no estandarizado, beta estandarizado, y correlación de Pearson) para analizar si son consistentes en cuanto a la dirección de la relación. ¿Qué diferencias observas entre ellos? Discute en qué situaciones cada uno de estos estimados es útil y qué información adicional proporciona el beta no estandarizado en comparación con la correlación de Pearson.
Respuesta:
Social Media and Depression Symptoms
Presentación del caso
La investigación “Social Media and Depression Symptoms: A Network Perspective” examina el impacto del uso pasivo de redes sociales (PSMU) en los síntomas de depresión entre estudiantes universitarios. El PSMU se refiere a la práctica de desplazarse sin interactuar activamente con el contenido, como ver publicaciones o fotos de las personas que sigues. Este tipo de uso ha sido asociado con efectos adversos en la salud mental, incluyendo un aumento en los niveles de soledad y síntomas de depresión (Verduyn et al., 2015; Frison & Eggermont, 2016). El objetivo de este estudio fue esclarecer la relación bidireccional entre el PSMU y los síntomas de depresión, así como el estrés, mediante un enfoque de red (network perspective). Esta perspectiva de la psicopatología sugiere que los síntomas de depresión no son meras consecuencias de un trastorno, sino que forman un sistema complejo y dinámico en el que los síntomas se influyen mutuamente (Borsboom, 2017). De este modo, el PSMU podría considerarse un factor de riesgo para la depresión si provoca síntomas individuales (como un estado de ánimo deprimido) o condiciones (como el estrés) que desencadenan otros síntomas depresivos (Fried et al., 2015).
Se reclutaron 132 estudiantes de psicología (91 mujeres, 41 hombres) a través de una plataforma en línea, de los cuales 125 completaron el seguimiento. Los participantes informaron sobre su uso pasivo de redes sociales (PSMU), síntomas de depresión y niveles de estrés siete veces al día durante 14 días utilizando el método de muestreo intensivo en el tiempo (ESM), que permite capturar experiencias en tiempo real y reducir sesgos de memoria. Se diseñó un cuestionario de 12 ítems que evaluaba el estado de ánimo, la pérdida de interés, la fatiga, la soledad y el estrés, utilizando una escala analógica visual (0 = nada; 100 = mucho) para obtener respuestas matizadas. Las mediciones se separaron por intervalos breves (aproximadamente 2 horas) y se utilizó la aplicación RealLife Exp de LifeData Company para recopilar los datos. Este procedimiento fue aprobado por la Junta de Revisión Institucional de la Universidad de Ámsterdam..
Este estudio plantea preguntas significativas sobre el efecto del uso de redes sociales en la salud mental de los jóvenes. Entre las interrogantes que podrían explorarse se incluyen: ¿Cuál es la relación entre el PSMU y los síntomas de depresión? ¿Cómo influye el PSMU en la sensación de soledad? ¿Existen diferencias significativas en los síntomas de depresión entre quienes practican el PSMU y aquellos que utilizan redes sociales de manera activa? ¿Cómo afectan el estrés y la fatiga al PSMU y a los síntomas depresivos? Responder estas preguntas no solo contribuye a una comprensión más profunda de las dinámicas entre el uso de redes sociales y la salud mental, sino que también puede guiar el desarrollo de intervenciones y políticas destinadas a mejorar el bienestar emocional de los estudiantes.
Actividades
Clase 1
Modelo de datos
En este estudio, los participantes reportaron varias veces al día variables como el estado de ánimo deprimido, estrés, soledad y fatiga, junto con el uso pasivo de redes sociales (PSMU). A continuación, debes calcular la media y desviación estándar de estas variables para el total de la muestra. Finalmente, responde ¿Qué nos dicen estos estadígrafos acerca de las variables de interés?
Respuesta:
De ahora en adelante, usaremos un promediado de cada una de las variables por sujeto, de manera que podamos realizar análisis a nivel intersujeto. Con esta información, podemos predecir los puntajes que obtendrá un sujeto en cada una de las variables en función de la media a nivel muestral, esto es lo que llamamos modelo nulo. A continuación, formularemos un modelo nulo para cada una de las variables anteriores. Luego, visualizaremos los residuos en un histograma para evaluar la magnitud de las desviaciones de los puntajes observados respecto a la media predicha.
Clase 2
Modelo de regresión
Para complejizar los modelos anteriores, podemos asumir una de las variables como predictora de otra. En este ejercicio, formularemos un modelo de regresión simple para explorar la relación entre los niveles de soledad (variable respuesta) y PSMU (variable predictora), es decir, cómo cambian los puntajes de soledad en la medida que aumenta o decrece el PSMU. Posteriormente, obtendremos los resultados del modelo e interpretaremos los parámetros (pendiente e intersección). ¿Cómo se relaciona el PSMU con la sensación de soledad?
Respuesta:
Caracterizando y comparando distribuciones
Para conocer cómo se distribuyen los puntajes de fatiga según el nivel de exposición al PSMU, vamos a dividir a los participantes en tres grupos: Bajo uso: participantes dentro del primer tercil de PSMU. Medio uso: participantes en el segundo tercil. Alto uso: participantes en el tercer tercil.
A continuación, calcula las medidas de tendencia central (media y mediana), variabilidad (desviación estándar y rango) y asimetría para cada uno de los grupos.
Visualiza las distribuciones de cada grupo utilizando histogramas y boxplots para identificar posibles diferencias.
Finalmente, compara los resultados entre los cinco quintiles y reporta las diferencias o similitudes que encuentres en la distribución de puntajes de fatiga según la exposición al PSMU
Respuesta:
Clase 3
Comparación de modelos
Vuelve sobre dos de los modelos que creaste en ejercicios anteriores: aquel que predice el nivel de fatiga a partir del promedio de la muestra (modelo nulo o base) y aquel que introduce como variable predictora el PSMU (modelo de regresión). Queremos saber cuánto mejora el ajuste del modelo al incluir el efecto de esta última variable. Para ello, calcula el R² de ambos modelos e interpreta qué proporción de la variabilidad en los puntajes de fatiga explica el uso pasivo de redes sociales.
Respuesta:
La distribución normal
A continuación, utilizaremos la distribución de los puntajes de estado de ánimo depresivo para calcular puntajes z y, con ello, interpretar la posición de cada individuo en relación con la media de la muestra. Este análisis nos permitirá determinar cómo se distribuyen los puntajes de estado de ánimo depresivo en la muestra, y observar cuántos participantes presentan niveles superiores o inferiores al promedio. Para ello,
Verifica la normalidad de la distribución de los niveles de estado de ánimo depresivo generando un histogramas o gráficos de densidad. También puedes realizar una prueba de normalidad (por ejemplo, Shapiro-Wilk) para verificar si los datos se aproximan a una distribución normal.
Con base en la media y desviación estándar del estado de ánimo depresivo, calcula el puntaje z de cada participante en esta variable.
Identifica cuántos participantes se encuentran por encima de 1 o 2 desviaciones estándar de la media, interpretando así los niveles de estado de ánimo depresivo altos en la muestra.
Respuesta:
En esta ocasión, simularemos datos para explorar cómo podrían distribuirse los puntajes de estrés de este estudio en una muestra más amplia y evaluaremos si estos resultados simulados reflejan patrones similares a los observados en los datos originales. Para ello,
Usa las medias y desviaciones estándar obtenidas previamente para simular dos nuevas muestras de puntajes de estrés, asumiendo una distribución normal en ambas. Genera 1,000 datos simulados para cada.
Visualiza las distribuciones simuladas de las dos muestras con histogramas y superpón curvas de densidad para comparar las distribuciones
Extrae una muestra aleatoria de 100 datos de cada una de las distribuciones simuladas y calcula sus estadísticos descriptivos (media, desviación estándar, percentiles). ¿Qué diferencias se observan en las distribuciones simuladas de los puntajes de estrés? ¿Qué implicaciones podrían tener estas diferencias para la comprensión del impacto del uso de redes sociales en los síntomas depresivos y posibles intervenciones?
Respuesta:
Clase 4
Modelo de regresión y correlación
Retomando el análisis de regresión simple, exploraremos la relación entre los niveles de soledad y el PSMU, pero esta vez usando la soledad como variable predictora y el PSMU como variable respuesta. Utilizaremos tres estimados estadísticos clave: beta no estandarizado, beta estandarizado, y correlación de Pearson. El primero indica cuánto cambia el PSMU por cada unidad adicional en el puntaje de soledad. Para obtener este valor, ajusta el modelo de regresión con las modificaciones correspondientes. Ejecuta el modelo de regresión y revisa la salida del modelo, donde el coeficiente del nivel de soledad será el valor de beta no estandarizado.
El segundo, el beta estandarizado, permite medir la relación en términos de desviaciones estándar, lo cual facilita la comparación de la magnitud del efecto. Para obtener este valor, estandariza tanto los puntajes de soledad como el puntaje de PSMU para que ambas variables tengan una media de 0 y una desviación estándar de 1. Luego, ajusta nuevamente el modelo de regresión con estas variables estandarizadas.
El tercero, la correlación de Pearson, te permitirá conocer la dirección y el tamaño de la relación entre la soledad y el PSMU en términos de asociación lineal. Calcula la correlación de Pearson entre ambas variables estandarizadas.
Finalmente, compara los tres estimados (beta no estandarizado, beta estandarizado, y correlación de Pearson) para analizar si son consistentes en cuanto a la dirección de la relación. ¿Qué diferencias observas entre ellos? Discute en qué situaciones cada uno de estos estimados es útil y qué información adicional proporciona el beta no estandarizado en comparación con la correlación de Pearson.
Respuesta:
Clase 5
Distribuciones de datos y distribuciones de probabilidad
En este ejercicio, usarás los valores de estado de estrés reportados en el estudio. Simularás distribuciones de 1,000 valores para cada uno de los siguientes tipos de distribuciones:
Genera gráficos de densidad o histogramas para cada distribución simulada y compáralos con la distribución real de los puntajes de estrés.¿Qué diferencias observas entre las distribuciones simuladas y la distribución real de los datos? ¿Cómo cambia la forma entre las distribuciones?
Respuesta:
Usando la primera distribución simulada (distribución normal con media y desviación estándar reales de los síntomas de estrés), calcula la probabilidad de que un participante tenga un nivel de estrés superior a 75. Compara este resultado con los datos reales.
Respuesta:
Ahora, queremos comparar los puntajes de estrés entre dos grupos de participantes, uno con alto uso de redes sociales y otro con bajo uso, utilizando las distribuciones de probabilidad t de Student y F. Para ello, divide los puntajes de estrés en dos grupos según el uso de redes sociales (alto y bajo), y calcula la media y varianza para cada grupo. Luego, aplica una prueba t para comparar las medias de los dos grupos y una prueba F para comparar las varianzas entre los grupos. ¿Existen diferencias significativas entre las medias y varianzas de los puntajes de estrés para los grupos con alto y bajo uso de redes sociales?
Respuesta:
Clase 6
Distribuciones muestrales
En este ejercicio, usarás los puntajes de pérdida de interés como el universo del cual se tomarán muestras. Simula 1,000 muestras de tamaño n = 30 y calcula el promedio de cada muestra. Visualiza la distribución de los promedios muestrales en un histograma y responde: ¿Cómo se distribuyen los promedios de las muestras simuladas? ¿Qué observas sobre la forma de la distribución?
Respuesta:
Para observar cómo cambia la distribución muestral a medida que aumenta el tamaño de muestra, utiliza las simulaciones previas y agrega 1,000 muestras de tamaño n=10, n= 50, y n=100. Calcula el promedio y desviación estándar de cada muestra y visualiza en un histograma las distribuciones muestrales del promedio para cada tamaño muestral. Luego, responde: ¿Cómo cambia la distribución muestral del promedio conforme aumenta el tamaño de la muestra? ¿Qué sucede con la variabilidad de los promedios?
Respuesta:
A continuación, construiremos intervalos de confianza para el promedio poblacional de los puntajes de pérdida de interés basados en las muestras simuladas. Para ello, elige una muestra simulada de tamaño n=50 y calcula el promedio y el intervalo de confianza al 95%. Finalmente, responde: ¿Qué significa el intervalo de confianza en términos de la estimación del promedio poblacional?
Respuesta:
Clase 7
La lógica del contraste de hipótesis en estadística con una media
Vuelve sobre el modelo nulo que creaste en la primera clase para predecir los puntajes de estado de ánimo deprimido en función del promedio de la muestra. A continuación, complejizaremos este modelo introduciendo como variable predictora el puntaje de PSMU. ¿Qué hipótesis queremos probar al sumar este efecto? Y si la hipótesis nula es aquella que niega los efectos de la variable predictora postulada en la hipótesis alternativa ¿Cuál sería la hipótesis nula dentro de este contexto?
Respuesta:
Calcula el valor p para el predictor PSMU del segundo modelo, que nos indicará si esta variable tiene un impacto significativo en los niveles de estado de ánimo deprimido.
¿El valor p asociado al PSMU es menor a 0.05? Si es así, ¿qué podemos concluir sobre la hipótesis alternativa?
Respuesta:
Clase 8
Comparando medias de dos grupos I
En este ejercicio, aplicarás un modelo de regresión lineal para analizar el efecto de un alto o bajo uso pasivo de redes sociales (PSMU) en los niveles de fatiga reportados por los participantes. Para ello,
Divide los puntajes de PSMU en dos grupos:
Alto uso: si el puntaje de PSMU está por encima de la media de la muestra.
Bajo uso: si el puntaje de PSMU está por debajo o igual a la media.
Crea una variable dicotómica (PSMU_dicotomico) que tome el valor de 1 para el grupo de alto uso y 0 para el grupo de bajo uso.
Ajusa un modelo de regresión lineal, usando la variable dicotómica como predictor y los niveles de fatiga como variable de respuesta, para evaluar si el alto uso pasivo de redes sociales predice mayores niveles de fatiga.
Analiza los coeficientes del modelo y el valor p asociado al predictor PSMU_dicotomico para responder las siguientes preguntas: ¿Es estadísticamente significativo el efecto de un alto PSMU sobre la fatiga? ¿Cómo interpretas la relación entre el uso pasivo de redes y los síntomas de fatiga según el coeficiente de PSMU_dicotomico?
Respuesta:
Clase 9
Comparando medias de dos grupos II
El estudio sugiere una relación entre el uso pasivo de redes sociales y problemas de concentración. En este ejercicio, compararemos los niveles de concentración entre los participantes con alto y bajo uso pasivo de redes sociales (PSMU), asumiendo que la desviación estándar de la muestra puede representar la desviación estándar de la población.
Calcula la media y desviación estándar de los puntajes de concentración para los grupos de alto y bajo uso de PSMU (usa la variable dicotómica que creaste para el ejercicio anterior).
Realiza una prueba z para comparar las medias de concentración entre los dos grupos.
Utiliza un boxplot para visualizar los resultados y evalúa si hay diferencias significativas entre los grupos de alto y bajo uso.
Respuesta:
En este ejercicio, compararemos los niveles de fatiga entre los participantes con alto uso pasivo (PSMU) y aquellos con alto uso activo (ASMU). Para ello, asumiendo varianzas iguales:
Uso Pasivo Predominante (PSMU): Participantes con un puntaje de PSMU más alto que ASMU.
Uso Activo Predominante (ASMU): Participantes con un puntaje de ASMU más alto que PSMU.
Respuesta:
Ahora, vuelve a realizar una prueba t de dos muestras independientes para comparar los niveles de fatiga entre el grupo de alto uso pasivo y el grupo de alto uso activo de redes sociales, esta vez sin asumir varianzas iguales. Visualiza los resultados utilizando un boxplot y observa cómo cambian los grados de libertad entre esta prueba y la del primer ejercicio (asumiendo varianzas iguales). ¿Existen diferencias en los resultados entre la prueba t con varianzas iguales y la que no asume varianzas iguales? ¿Cómo afectan los grados de libertad a los resultados? ¿Proporcionan ambos enfoques resultados consistentes sobre el efecto de fatiga en los distintos tipos de uso de redes?
Respuesta:
En este ejercicio, analizaremos si existen diferencias significativas en los niveles de sentimiento de inferioridad entre los grupos de alto y bajo uso pasivo (PSMU) y activo (ASMU) de redes sociales. Para ello,
Respuesta:
Clase 10
Comparando medias de tres o más grupos ll
El nivel de uso activo de redes sociales (ASMU) podría estar relacionado con la pérdida de interés, ya que una mayor interacción podría asociarse con sobrecarga informativa. En este ejercicio, analizaremos si existen diferencias significativas en los niveles de fatiga en función del nivel de ASMU. Para ello,
Clasifica ASMU en tres niveles (bajo, medio y alto).
Crea variables dummy para representar los tres niveles de ASMU (seleccionando uno como categoría de referencia).
Evalúa los coeficientes de las variables dummy en la regresión para determinar si existen diferencias significativas en los niveles de pérdida de interés según el nivel de uso activo de redes sociales (ASMU). Además, interpreta cada coeficiente de regresión para ver cómo cambia la pérdida de interés en comparación con el nivel de referencia de ASMU.
Respuesta:
En este ejercicio, analizaremos cómo los niveles de estrés afectan el uso activo de redes sociales (ASMU). Para ello, se trabajará con la variable estrés recodificada en grupos.
Calcula los cuartiles de la variable estrés y crea una nueva variable dicotómica agrupando los dos cuartiles inferiores como “bajo estrés” y los dos superiores como “alto estrés”.
Compara los niveles promedio de ASMU entre los grupos de estrés (bajo vs. alto).
Representa las diferencias en el uso activo de redes sociales mediante un gráfico de caja y bigotes (boxplot).
Si el ANOVA muestra diferencias significativas, realiza una prueba post-hoc (como Tukey) para identificar qué niveles específicos de estrés afectan el uso activo de redes sociales.
Interpreta los resultados: ¿Existe una relación significativa entre el nivel de estrés y el uso activo de redes sociales?
Respuesta:
Clase 12
Regresión múltiple I
El nivel de uso activo de redes sociales (ASMU) y los niveles de soledad pueden influir conjuntamente en los niveles de fatiga de los participantes. Este ejercicio tiene como objetivo explorar cómo la combinación de estos factores afecta la percepción de fatiga. Para ello,
Dicotomiza las variables:
Codifica ASMU en dos niveles: alto (1) y bajo (0).
Codifica soledad en dos niveles: alto (1) y bajo (0).
Genera una variable de interacción entre ASMU y soledad.
Ajusta un modelo de regresión múltiple en el que fatiga sea la variable dependiente, y ASMU, soledad, y la interacción entre ambas sean las variables independientes.
Evalúa los coeficientes de las variables y de la interacción para determinar: (1) Si el uso activo de redes sociales tiene un efecto significativo sobre los niveles de fatiga, (2) si los niveles de soledad afectan significativamente los niveles de fatiga, y (3) si la interacción entre el uso activo de redes y la soledad tiene un efecto significativo sobre la fatiga.
Respuesta:
Clase 13
Regresión múltiple II
Queremos analizar cómo los sentimientos de inferioridad pueden variar en función de la frecuencia de uso pasivo de redes sociales (PSMU) y los niveles de fatiga. Para ello,
Dicotomiza la Variable Fatiga: Codifica fatiga como alto (1) y bajo (0) según el percentil 50 como punto de corte.
Ajusta un modelo de regresión múltiple donde la variable dependiente es sentimientos de inferioridad y las variables independientes son la cuantitativa PSMU, la dicotómica fatiga, y su interacción.
Crea un gráfico que permita visualizar cómo los niveles de sentimientos de inferioridad varían en función de la frecuencia de PSMU y los niveles de fatiga.
Evalúa los coeficientes de las variables y de la interacción para describir: (1) Si el uso pasivo de redes sociales tiene un efecto significativo sobre los sentimientos de inferioridad, (2) si los niveles de fatiga afectan significativamente los sentimientos de inferioridad, y (3) si la interacción entre el uso pasivo de redes y la fatiga es significativa en la predicción de los sentimientos de inferioridad.
Respuesta:
Clase 14
Medidas de asociación de dos variables categóricas
A continuación responderemos a la pregunta ¿Existe una asociación significativa entre el nivel de uso activo de redes sociales (ASMU) y el estado de ánimo depresivo? Para ello:
Construye una tabla que muestre la frecuencia de las diferentes combinaciones entre el nivel de uso activo de redes sociales (ASMU) y el nivel de estado de ánimo depresivo
Clasifica ASMU en dos niveles (bajo y alto) según el promedio de la muestra.
Clasifica el estado de ánimo depresivvo en dos niveles (bajo y alto) usando el percentil 50 como punto de corte.
Luego, realiza la prueba de chi-cuadrado para analizar si hay una asociación significativa entre ambas variables categóricas.
Finalmente, evalúa el valor p de la prueba y determina si existe una asociación significativa entre el nivel de uso activo de redes sociales y el estado de ánimo deprimido.
Respuesta: