Hey Folks,
Sejam bem vindos ao primeiro treinamento de Azure Databricks do BRASIL!
Esse treinamento segue o formato da Databricks Academy e possui boa parte do material para quem deseja se certificar na plataforma. O principal motivo desse treinamento é para que você possa entender as reais tarefas de um Data Engineer e Data Scientist em empresas como Spotify, Waze, AirBNB, Netflix e outras.
Hoje, empresas buscam profissionais qualificados para construir Data Pipelines capazes de se conectar, processar e analisar dados de forma rápida e eficiente, normalmente essa tarefa é atribuída para um Data Engineer.
Após a democratização dos dados no Data Lake, Data Scientists precisam, entender a diversidade das informações e criar modelos de ML para entender o futuro e qualificar ainda mais o dados para sua empresa.
Nesse treinamento você irá navegar entre esses dois mundos, que são tão distintos mas ao mesmo tempo compartilham diversas coisas em comum, isso possibilitará com que você possa se adaptar ao novo mercado de trabalho e entender porque profissionais que possuem esse tipo conhecimento são tão raros hoje em dia.
O treinamento será prático, com todos os materiais disponibilizados no GitHub e com ambiente compartilhado no Azure Databricks para que você possa sair do treinamento capacitado.
Quer ser um Data Engineer ou um Data Scientist? Então não perde tempo, as vagas mesmo ONLINE são limitadas! Se inscreve e faça parte dos profissionais mais valiosos do mercado.
==================================================
==================================================
==================================================
CONTEÚDO PROGRAMÁTICO
The Fundamentals
* Big Data
* Scala & Python
* Apache Spark
* Azure Databricks
Apache Spark Overview
* Spark Architecture
* Spark Internals
* Catalyst Query Optimizer
Apache Spark Programming
* SQL, DataFrames, and DataSets
* Spark Structured Streaming
Azure Databricks
* Clusters
* Workspace & Notebooks
* Visualizations
* Data Sources, Access and Tables
* Libraries
* Jobs
* Secrets
* Developer Tools
* Databricks File System - DBFS
* Databricks IO Cache
Data Engineering Use-Cases
* ETL using DataFrames and SparkSQL API
* Creating a Data Warehouse Solution on Microsoft Azure
* Ingesting Data using Databricks Delta Storage Layer
* Structured Streaming with Apache Kafka & Apache Spark
Python & Statistics Review
* Overview
* Python 101
* Python 201
* Statistics 101
* Statistics 201
Data Wrangling
* Overview
* Data Structures
* Data Quality
* Data Transformation
* Review & Exercises
Exploratory Data Analysis
* Overview
* Univariate Analysis
* Bivariate Analysis
* Multivariate Analysis
* Review & Exercises
Machine Learning
* Overview
* Regression
* Classification
* Clustering
* Review & Exercises
Use-Cases
* General Review
* Predicting with Data
* Sentiment Analysis on Twitter
* Investigating Politicians’ Spending
* Conclusion
==================================================
==================================================
==================================================