Introducción a la ingeniería de datos con Microsoft Azure Nanodegree

La ingeniería de datos es la práctica de diseñar y construir sistemas para recopilar, organizar, analizar y procesamiento de datos en varias formas. Se sabe que los ingenieros de datos tienen una mente analítica que puede identificar patrones y usarlos para hacer predicciones. También son responsables de diseñar bases de datos y estructuras de datos. Los ingenieros de datos trabajan en muchas industrias, incluidas las finanzas, el marketing minorista e incluso la atención médica.

Con Ingeniería de datos con Microsoft Azure Nanodegree, aprenderá a diseñar modelos de datos, construir almacenes de datos, construir lagos de datos y arquitectura de lagos, crear canalizaciones de datos y trabajar con grandes conjuntos de datos en la plataforma Azure usando Azure Synapse Analytics, Azure Databricks y Factoría de datos de Azure.

Contenido

CARRERA 1: Modelado de datos

Instructora: Amanda Moran

Después de pasar los últimos 6 años como ingeniera de software en 4 bases de datos distribuidas diferentes, Amanda es una desarrolladora defensora de DataStax. Su pasión es cerrar la brecha entre los clientes y la ingeniería. Tiene títulos de la Universidad de Washington y la Universidad de Santa Clara.

En este curso, aprenderá a crear modelos de datos relacionales y NoSQL para adaptarse a las diversas necesidades de los consumidores de datos. Comprenderá las diferencias entre los diferentes modelos de datos y cómo elegir el modelo de datos adecuado para una situación determinada. También adquirirá fluidez en PostgreSQL y Apache Cassandra.

PROYECTO 1: Modelado de datos con Postgres

En este proyecto, modelará datos de actividad de usuario para una aplicación de transmisión de música llamada Sparkify. Creará una base de datos relacional y una canalización ETL diseñada para optimizar las consultas para comprender qué canciones escuchan los usuarios. En PostgreSQL, también definirá tablas de hechos y dimensiones e insertará datos en sus nuevas tablas.

PROYECTO 2: Modelado de datos con Apache Cassandra

En este proyecto, modelará datos de actividad de usuario para una aplicación de transmisión de música llamada Sparkify. Creará una base de datos y una canalización ETL en Postgres y Apache Cassandra, diseñados para optimizar las consultas para comprender qué canciones escuchan los usuarios. Para PostgreSQL, también definirá tablas de hechos y dimensiones e insertará datos en sus nuevas tablas. Para Apache Cassandra, modelará sus datos para que pueda ejecutar consultas específicas proporcionadas por el equipo de análisis de Sparkify.

CARRERA 2: Almacenes de datos en la nube con Azure

Instructor: Matt Swaffer

Matt es un profesional de la ciencia de datos cuya carrera abarca el desarrollo de software, el diseño de la experiencia del usuario y la visualización de datos. Obtuvo su doctorado en psicología cognitiva en el aprendizaje humano y es profesor adjunto de cursos de diseño de software.

En este curso, aprenderá a crear almacenes de datos basados ​​en la nube y mejorará sus habilidades de almacenamiento de datos, profundizará su conocimiento de la infraestructura de datos y será introducido a la ingeniería de datos en la nube usando Azure. Comenzará con una introducción a los almacenes de datos y ETL, seguida de una introducción a la tecnología de almacenamiento de datos y ELT en la nube. Después de esto, aprenderá sobre la tecnología de almacenamiento de datos en la nube en Azure, incluido Azure Synaps Analytics.

PROYECTO 3: Construcción de Azure Data Warehouse para Bikeshare Data Analytics

En este proyecto, creará una solución de almacenamiento de datos con Azure Synaps Analytics para comprender mejor Divvy, un programa para compartir bicicletas. Comenzará por importar datos a Synapse Analytics, luego transformará los datos en un esquema de estrella y verá informes de Analytics para identificar cuánto tiempo y dinero se gasta por viaje.

CURSO 3: Data Lakes y Lakehouse con Spark y Azure Databricks

Instructor: Matt Swaffer

Matt es un profesional de la ciencia de datos cuya carrera abarca el desarrollo de software, el diseño de la experiencia del usuario y la visualización de datos. Obtuvo su doctorado en psicología cognitiva en el aprendizaje humano y es profesor adjunto de cursos de diseño de software.

En este curso, aprenderá sobre el ecosistema de big data y cómo usar Spark para trabajar con conjuntos de datos masivos. También almacenará big data en un lago de datos y desarrollará una arquitectura de lago en la plataforma Azure Databricks.

PROYECTO 4: Creación de un Azure Data Warehouse para Bikeshare Data Analytics

En este proyecto, creará una solución de almacenamiento de datos con Azure Synaps Analytics para comprender mejor Divvy, un programa para compartir bicicletas. Comenzará por importar datos a Synapse Analytics, luego transformará los datos en un esquema de estrella y verá informes de Analytics para identificar cuánto tiempo y dinero se gasta por viaje.

CURSO 4: Canalizaciones de datos con Azure

Instructor: Vishnu (Lucky) Pamula

Lucky es un evangelista de datos e inteligencia artificial con un historial de ayudar con éxito a las organizaciones a crear soluciones de análisis. Además de su trabajo diario, enseña como profesor adjunto, entrega lunch & learns, asesora a estudiantes y evangeliza Azure Quantum como embajador.

En este curso, aprenderá a crear, orquestar, automatizar y monitorear canalizaciones de datos en Azure mediante Azure Data Factory y canalizaciones en Azure Synapse Analytics. Creará, activará y supervisará canalizaciones de datos en la plataforma Azure para cargas de trabajo analíticas y ejecutará transformaciones de datos, optimizará flujos de datos y trabajará con canalizaciones de datos en producción.

PROYECTO 5: Canales de integración de datos para el análisis de datos de nómina de NYC

A la ciudad de Nueva York le gustaría desarrollar una plataforma de análisis de datos mediante Azure Synapse Analytics para analizar cómo se asignan los recursos financieros de la ciudad y cuánto del presupuesto de la ciudad se dedica a las horas extra.

Lo contrataron como ingeniero de datos para crear canalizaciones de datos de alta calidad que sean dinámicas, se puedan automatizar y se puedan monitorear para una operación eficiente.

Los datos de origen residen en Azure Data Lake y creará canalizaciones con Azure Data Factory para que los datos históricos y nuevos se procesen en un almacén de datos de Nueva York en Azure Synapse Analytics.

Comience su carrera de ingeniería de datos hoy

Con el Nanogrado de Ingeniería de Datos con Microsoft Azure, estará preparado para comenzar una carrera en ingeniería de datos y tener un impacto en el campo de los grandes datos.

COMIENZA A APRENDER

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *