Guía interactiva 6: Manejo de bases de datos

Instrucciones

  • Esta guía contiene una serie de acciones que deberá realizar tanto en R como en Excel asociadas al manejo de bases de datos. En cada ejercicio, con la ayuda de algún modelo de lenguaje de inteligencia artificial (preferentemente Chat GPT), debe replicar las acciones desarrolladas en R también en Excel.

  • Adicionalmente, debe incorporar junto a esta guía el registro de las preguntas y respuestas producto de las interacción con el modelo de lenguaje de inteligencia artificial, junto con la versión y el tipo de inteligencia artificial utilizada. También, debe adjuntar el archivo Excel sobre el cual trabajó.

  • Durante el desarrollo de la guía NO DEBE MODIFICAR los códigos entregados. Asimismo, recuerde no alterar el formato de este documento y responder en los espacios asignados.

  • Usaremos datos recolectados por el Observatorio Social mediante la tercera ronda de la Encuesta Longitudinal de Primera Infancia (2017), sobre el desarrollo de niños, niñas y adolescentes de la población chilena. Específicamente, estaremos trabajando con la aplicación del Battelle, un instrumento que evalúa el desarrollo de niños y niñas.

  • El archivo con los datos se llama:

elpi2017.csv
  • El contenido de estos datos incluye:
#-------------------------------------------------------------------
# contenido de los datos
#-------------------------------------------------------------------
 $ folio           : num 640621 557331 516651 681771 554401 … #Número de folio asociado a cada NNA
 $ finicio_tn      : Date  "2018-01-05" "2018-05-07" "2018-03-17" … #Fecha en la que fue aplicada la encuesta a cada NNA
 $ edad_mesesr     : num 59 80 101 31 92 80 20 68 135 44 … #Edad en meses
 $ nivel_edu_niño  : chr [1:3000] "Nivel 3" "Nivel 3" "Nivel 5" "Nivel 1" … #Nivel educativo
 $ Primera pregunta: num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta movilidad reducida en extremidades superiores)
 $ Segunda pregunta: num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta movilidad reducida en extremidades inferiores)
 $ Tercera pregunta: num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta dificultades en el habla)
 $ Cuarta pregunta : num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta dificultades para oír, aún usando audífonos)
 $ Quinta pregunta : num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta dificultades para ver, aún usando lentes)
 $ bt_p1           : num [1:3000] NA NA NA NA NA NA NA 0 NA NA ...
 $ bt_p2           : num [1:3000] NA NA NA NA NA NA NA 0 NA NA ...
 $ bt_p3           : num [1:3000] NA NA NA NA NA NA NA 0 NA NA ...
 $ bt_p4           : num [1:3000] NA NA NA NA NA NA NA 0 NA NA ...
 $ bt_p5           : num [1:3000] NA NA NA NA NA NA 2 0 NA NA ...
…

# Nota: La base contiene más información pero no es presentada en por extensión.

Ejercicio 1. Cargar datos.

Para poder iniciar esta guía, abra estos datos, y guardelos en un objeto llamado datos_elpi.

datos_elpi <- read.csv("https://david-ti.github.io/introstats/data/elpi2017.csv")

Ahora, usted debe solicitar a la IA que lo ayude en transformar la base de datos desde un formato csv a un archivo formato xsl (Excel). Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta:

Ejercicio 2. Eliminar columna.

Al revisar la base de datos notará una primera columna que solo indica el número de cada una de las observaciones. Debe eliminar esta columna. A continuación, indique el código utilizado en R.

Ahora, usted debe solicitar debe replicar la misma acción en Excel. Recuerde que puede solicitar ayuda a la IA. Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta:

Ejercicio 3. Transformación de una variable numérica.

La base de datos contiene la variable ‘edad_mesesr’, la cual indica la edad de los niños y niñas en meses. Usted debe crear una variable llamada ‘edad_años’, la cual debe indicar la edad de los niños y niñas en años. Es decir, debe considerar la edad en meses y calcular el equivalente en años. A continuación, indique el código utilizado en R.

Ahora, usted debe solicitar debe replicar la misma acción en Excel. Recuerde que puede solicitar ayuda a la IA. Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta:

Ejercicio 4. Transformación de una variable categórica a numérica.

La base de datos contiene la variable ‘nivel_edu_niño’, la cual indica el nivel educativo de los niños y niñas. Esta variable es de tipo categórica, es decir, contiene los valores “Nivel 1”, Nivel 2, hasta “Nivel 5”. Usted debe transformar esta variable en una variable numérica, es decir, debe contener los valores, 1, 2 hasta 5. A continuación, indique el código utilizado en R.

Ahora, usted debe solicitar debe replicar la misma acción en Excel. Recuerde que puede solicitar ayuda a la IA. Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta:

Ejercicio 5. Cambiar nombre de variable.

La base de datos contiene las variables “Primera pregunta”, “Segunda pregunta”, “Tercera pregunta”, “Cuarta pregunta” y “Quinta pregunta”. Estas preguntas son relevantes para evaluar si es que se deben tener ciertas consideraciones en el proceso de aplicación del Battelle. A continuación, se presentan las especificaciones de estas variables.

$ Primera pregunta: num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta movilidad reducida en extremidades superiores) $ Segunda pregunta: num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta movilidad reducida en extremidades inferiores) $ Tercera pregunta: num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta dificultades en el habla) $ Cuarta pregunta : num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta dificultades para oír, aún usando audífonos) $ Quinta pregunta : num [1:3000] 0 0 0 0 0 0 0 0 0 0 … # 0=No; 1=Sí (Presenta dificultades para ver, aún usando lentes)

Usted debe modificar el nombre de estas variables para que sus nombres sean descriptivos del contenido de la información de cada una. A continuación, indique el código utilizado en R.

Ahora, usted debe solicitar debe replicar la misma acción en Excel. Recuerde que puede solicitar ayuda a la IA. Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta:

Ejercicio 6. Descriptivos.

Respecto a las cinco variables consideradas en el ejercicio 5, usted debe señalar por variable cuántos niños y niñas tienen presencia de dicha variables y cuántas no. También, es importante que revise y reporte si es que hay niños y niñas que tengan presencia conjunta de las cinco variables o no. A continuación, indique el código utilizado en R.

-Respuesta:

Ahora, usted debe solicitar debe replicar la misma acción en Excel. Recuerde que puede solicitar ayuda a la IA. Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta:

Ejercicio 7. Creación de variables.

La base de datos contiene el puntaje de cada uno de los niños y niñas en cada una de las preguntas del Battelle. Debe generar una variable llamada ‘puntaje_bt’ la cual debe almacenar el promedio de cada niño y niñas en el Battelle. Para el cálculo del promedio debe considerar que no todos los niños y niñas tienen puntajes en todas las preguntas, es decir, el cálculo del promedio de cada niño y niña debe considerar cada pregunta que respondió. A continuación, indique el código utilizado en R.

Ahora, usted debe solicitar debe replicar la misma acción en Excel. Recuerde que puede solicitar ayuda a la IA. Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta:

Ejercicio 8. Distribución.

Considerando la variable creada en el ejercicio 7, genere un gráfico que permita visualizar la distribución de los puntajes de los niños y niñas en el Battelle. A continuación, indique el código utilizado en R.

Ahora, usted debe solicitar debe replicar la misma acción en Excel. Recuerde que puede solicitar ayuda a la IA. Ingrese a continuación la acción llevada a cabo en Excel y si es que corresponde, el prompt que utilizó para solicitar ayuda.

-Respuesta: