--- title: "Análisis exploratorio de datos" author: "Nombre del estudiante" date: "`r Sys.Date()`" output: html_document --- ```{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE) ``` ## 1. Carga de datos ```{r} # Instalar paquetes si no están instalados # install.packages("readxl") # install.packages("tidyverse") # install.packages("psych") library(readxl) library(tidyverse) library(psych) # Cargar archivo Excel (ajusta la ruta si es necesario) datos <- read_excel("X1100_datos.xlsx") # Ver primeras filas head(datos) # Ver nombres de las variables names(datos) # Ver estructura general str(datos) ``` ## 2. Limpieza y exploración inicial ```{r} # Verificar valores perdidos colSums(is.na(datos)) # Opcional: convertir variables si es necesario # datos$variable <- as.factor(datos$variable) ``` ## 3. Estadística descriptiva ```{r} # Descriptivos generales summary(datos) # Descriptivos más detallados describe(datos) # Ejemplo: tabla de frecuencia para una variable categórica # table(datos$nombre_variable) ``` ## 4. Visualización de datos ```{r} # Histograma # ggplot(datos, aes(x = variable_numerica)) + # geom_histogram(bins = 30) # Boxplot # ggplot(datos, aes(y = variable_numerica)) + # geom_boxplot() # Gráfico de barras # ggplot(datos, aes(x = variable_categorica)) + # geom_bar() # Diagrama de dispersión # ggplot(datos, aes(x = var1, y = var2)) + # geom_point() ``` ## 5. Interpretaciones Escribe aquí tus interpretaciones en texto. Puedes responder: - ¿Qué aprendiste sobre los datos? - ¿Qué variables parecen más relevantes? - ¿Encontraste valores atípicos o relaciones interesantes? --- ## 6. Cruce de variables: Categórica vs Cuantitativa ### a) Estadísticas agrupadas ```{r} # Reemplaza 'grupo' por tu variable categórica # Reemplaza 'valor' por tu variable numérica # Media, mediana y desviación estándar por grupo datos %>% group_by(grupo = nombre_de_variable_categorica) %>% summarise( Media = mean(nombre_de_variable_numerica, na.rm = TRUE), Mediana = median(nombre_de_variable_numerica, na.rm = TRUE), Desviación = sd(nombre_de_variable_numerica, na.rm = TRUE), n = n() ) ``` ### b) Visualización: Boxplot ```{r} # Boxplot para comparar distribución por grupo ggplot(datos, aes(x = nombre_de_variable_categorica, y = nombre_de_variable_numerica)) + geom_boxplot() + labs( title = "Comparación por grupos", x = "Categoría", y = "Valor numérico" ) ``` ### ✍️ Interpretación Comenta aquí: - ¿Hay diferencias visibles entre los grupos? - ¿Hay más variabilidad en algún grupo? - ¿Qué conclusiones puedes sacar del boxplot y del resumen? --- ## Conclusión final Resume brevemente tus hallazgos y reflexiona sobre la utilidad del análisis exploratorio con R.