Los sistemas de big data pueden combinar datos generados a través de IoT y ciencia de datos para mejorar costos, energía, impacto ambiental en sistemas de movilidad y transporte.
El curso se puede enfocar al uso de distintos conjuntos de datos para analizar problemáticas comunes en la movilidad en México, por ejemplo, diseño de rutas óptimas, identificación de puntos de transición multimodal, identificación de perfil de usuarios, etc.
Contenido:
1. Introducción a Big Data
Definición
Conceptos Básicos
Tipos de datos
Ejemplos
Retos de trabajar con big data
2. Infraestructura, Tecnologías y Arquitectura de Big Data
Conceptos básicos SQL vs NoSQL
Arquitectura de datos
Online transaction processing
Online analytical processing
Star Schema
Snowflake schema
Batch vs Streaming Processing
3. Introducción a SQL y Modelado de datos
Databricks workspace
¿Qué es una base de datos relacional?
Relational Database Management System (RDBMS)
SQL
Normalización de datos
4. SQL Labs
Comandos SQL
5. PySpark
Medallion Architecture
Star Schema
6. PySpark para Machine Learning
ML con PySpark
7. Visualización de datos
Tableau
PowerBi
8. Forecasting
Modelos de forecasting
Prophet
9. Proyecto Final Data Lakehouse
Data Analytics con Big Data
Data Mining y Machine Learning con Big Data
Acerca del instructor:
Kommentare