Aprenda ingeniería de datos con AWS

Según TechJury, las personas produjeron 2,5 quintillones de bytes de datos por día en 2021. Los datos ahora se han convertido en el elemento vital de la transformación digital, y las empresas se esfuerzan por reinventarse como organizaciones basadas en datos. Es por eso que, según Indeed y Glassdoor, la proporción de vacantes de ingeniero de datos y científico de datos es de aproximadamente cuatro a uno. Las empresas no pueden encontrar suficientes ingenieros de datos para almacenar, organizar y administrar su cantidad cada vez mayor de datos.

Los ingenieros de datos son responsables de hacer que los datos sean accesibles para todas las personas que los usan en una organización. Eso podría significar crear un almacén de datos para el equipo de análisis, construir una canalización de datos para una aplicación front-end o resumir conjuntos de datos masivos para que sean más fáciles de usar.

Hoy, nos complace anunciar una actualización del programa Ingeniería de datos con AWS Nanodegree. Empresas de todo el mundo están buscando ingenieros de datos y nuestro objetivo es ayudar a cualquier persona que desee conseguir un trabajo en el campo a hacerlo.

Contenido

Detalles del programa Ingeniería de datos con AWS Nanodegree.

El programa Data Engineering with AWS Nanodegree lo preparará para ser un ingeniero de datos, con capacitación especial en herramientas de datos de AWS. Específicamente, los estudiantes aprenderán a:

  • Cree modelos de datos relacionales y NoSQL fáciles de usar
  • Cree almacenes de datos escalables y eficientes
  • Trabaje eficientemente con conjuntos de datos masivos
  • Cree e interactúe con un lago de datos basado en la nube
  • Automatice y supervise las canalizaciones de datos
  • Desarrollar competencia en las herramientas Spark, Airflow y AWS

Para sacarle el máximo partido a este programa, es importante saber programar, en concreto con conocimientos intermedios de Python. Además, los estudiantes deben comprender cómo usar la línea de comandos y tener una base sólida en SQL.

En tan solo 4 meses (de 5 a 10 horas a la semana), los estudiantes que se inscriban en el programa Ingeniería de datos con AWS Nanodegree aprenderán cómo modelar datos con Apache Cassandra, interactuar con almacenes de datos (extracción y transformación de datos) y utilizar lagos de datos (exportar, transformar e importar datos) y crear canalizaciones de datos personalizadas.

Cambios del programa de ingeniería de datos anterior.

Desde el lanzamiento del programa Data Engineering Nanodegree en 2019, ha habido muchos cambios en las herramientas de AWS que se utilizan para los proyectos del curso. Si bien nos encanta que las herramientas se actualicen y mejoren constantemente, significó que algunas de nuestras lecciones comenzaron a sentirse un poco desactualizadas.

Para satisfacer mejor las necesidades de nuestros estudiantes del programa Nanodegree, hemos actualizado nuestros cursos y proyectos para que reflejen más de cerca las herramientas actuales y el estado de la ingeniería de datos. A continuación, encontrará una lista de los cursos en el programa Ingeniería de datos con AWS Nanodegree con información sobre lo que ha cambiado.

Carrera 1: Modelado de datos
Toda la excelente información sobre el modelado de datos todavía está disponible, pero eliminamos un proyecto llamado Modelado de datos con Postgres que sentimos que no era coherente con los otros cursos que solo tenían un proyecto.

Carrera 2: Almacenes de datos en la nube
Actualizamos la totalidad de este curso para reflejar los nuevos conceptos y herramientas de AWS. Esto incluye nuevas imágenes, videos, transcripciones e instrucciones de AWS. También actualizamos la guía del proyecto (consulte el Proyecto 2, a continuación) para abordar las brechas en función de los comentarios de los estudiantes.

Carrera 3: Spark y lagos de datos
Hicimos muchas actualizaciones en el curso 3 para que coincida más con los estándares de la industria en torno a la ingeniería de datos. Los cambios específicos incluyen contenido actualizado sobre el ecosistema de big data, el uso de una nueva versión de Spark (y los scripts de Spark que lo acompañan), la adición de conceptos sobre los patrones de diseño de Lakehouse y el uso de AWS Glue y AWS Athena. Para este curso, renovamos todo el proyecto final para centrarnos más en el Internet de las cosas (IoT) y los datos de aplicaciones, que están seleccionados para que los utilicen los científicos de datos.

Curso 4: Automatice las canalizaciones de datos
La mayoría de las actualizaciones para el curso 4 están relacionadas con las herramientas, para ayudar a los estudiantes a familiarizarse con las herramientas que son los estándares actuales de la industria. Por ejemplo, el curso 4 ahora usará Airflow 2 en lugar de Airflow 1. También introdujimos Airflow Python Decorators, pasamos de Redshift Cluster a Redshift Serverless y ahora tenemos un espacio de trabajo para estudiantes que usa VS Code.

Ingeniería de datos con información del proyecto AWS.

Proyecto 1: Modelado de datos con Apache Cassandra
Los estudiantes modelarán datos de eventos para crear una base de datos no relacional y canalizaciones de extracción, carga y transformación (ELT) para una aplicación ficticia de transmisión de música. El proyecto incluirá la definición de consultas y tablas para una base de datos construida con Apacha Cassandra.

Proyecto 2: Almacén de datos
Los estudiantes actuarán como ingenieros de datos para un servicio de transmisión de música. Crearán una canalización ELT que extraiga datos de S3, los organizarán en Redshift y los transformarán en un conjunto de tablas dimensionales para que las utilice un equipo de análisis.

Proyecto 3: Análisis de equilibrio humano STEDI
Los estudiantes crearán una solución de Data Lakehouse para datos de sensores que se utiliza para entrenar un modelo de aprendizaje automático para una empresa ficticia de equilibrio humano, STEDI. El proyecto incluye la creación de una canalización de ELT para la arquitectura de Lakehouse, la carga de datos de un lago de datos de AWS S3 y el procesamiento de los datos en tablas de análisis mediante Spark y AWS Glue y, finalmente, la carga nuevamente en la arquitectura de Lakehouse.

Proyecto 4: Canalizaciones de datos con Airflow
Los estudiantes construirán canalizaciones de datos de alto grado para Sparkify. Primero, los estudiantes tomarán registros de datos de usuario y metadatos como JSON de S3 y los procesarán en un almacén de datos (Amazon Redshift). Para completar el proyecto, los estudiantes deben crear sus propios operadores personalizados para realizar tareas como preparar los datos, llenar el almacén de datos y ejecutar verificaciones finales de los datos.

Aprenda de los mejores profesionales de datos.

Para desarrollar el plan de estudios de clase mundial de este programa, colaboramos con profesionales de empresas tecnológicas de primer nivel, como Amazon, DataStax y SpotHero. Cada uno de estos colaboradores contribuyó con orientación y retroalimentación para enfocar el programa en las habilidades más demandadas. Cada uno de los instructores cuenta con amplios datos y experiencia docente.

instructores

  • Amanda Moran, promotora de desarrolladores en DataStax
  • Ben Goldberg, ingeniero de personal en SpotHero
  • Valerie Scarlata, Gerente de Currículo en Udacity
  • Matt Swaffer, arquitecto de soluciones y profesor adjunto de la Universidad del Norte de Colorado
  • Sean Murdock, ingeniero de software y profesor de la Universidad Bringham You, Idaho

Inscríbase hoy mismo en el programa Ingeniería de datos con AWS Nanodegree.

Si es un ingeniero interesado en especializarse en ingeniería de datos, o si tiene algo de experiencia en ingeniería de datos pero quiere aprender todo sobre las diversas herramientas de datos de AWS, este es el programa para usted.

Nunca ha habido un mejor momento para entrar en la ingeniería de datos. De hecho, la ingeniería de datos se encuentra entre los roles de más rápido crecimiento en la industria tecnológica. Además, los salarios de los ingenieros de datos promedian bien en el rango de seis cifras.

Con el aprendizaje práctico centrado en proyectos de Udacity, no hay mejor manera de satisfacer la demanda que registrándose hoy para el programa de ingeniería de datos con AWS Nanodegree. ¡Inscríbase ahora para obtener más información!

COMIENZA A APRENDER

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *