Análisis de Desempeño Estudiantil con Scala y Databricks
Contexto del Proyecto
Este proyecto utiliza Scala y la plataforma Databricks para analizar un conjunto de datos relacionado con factores que afectan el desempeño académico de los estudiantes. Se aplican técnicas de transformación de datos y funciones avanzadas para responder preguntas clave y generar visualizaciones que permitan interpretar los resultados de manera efectiva.
Objetivos del Proyecto
- Explorar el dataset: Identificar patrones y relaciones entre factores como horas de estudio, género, ingreso familiar, y actividades extracurriculares.
- Aplicar transformaciones de datos: Uso de funciones avanzadas como
groupBy,orderBy,whereyfunciones agregadas(AVG,SUM)para responder preguntas analíticas. - Generar visualizaciones: Aprovechar las herramientas de visualización integradas en Databricks para una presentación clara de los hallazgos.
Tecnologías Usadas
Lenguaje
- Scala
Plataforma
- Databricks
Visualización de Datos
- Herramientas nativas de Databricks
Dataset
- Factores que afectan el desempeño académico de estudiantes
Enlaces
- Repositorio en GitHub: Análisis con Scala y Databricks
- Archivo HTML del Código: Código del Proyecto