Nós usamos cookies para criar uma experiência de navegação melhor. Ao acessar o site da MENTORAMA, você concorda com nossa Política de Cookies.
Entendi
Close
Nós usamos cookies para criar uma experiência de navegação melhor. Ao acessar o site da MENTORAMA, você concorda com nossa Política de Cookies.
Entendi
Close

Cientista de dados do zero ao PRO

Escola online das profissões
mais procuradas
Oferta especial de 50% de desconto apenas para as primeiras 20 vagas

Atenção, esta promoção exclusiva acaba em:
10 : 44 : 16
0 :
Horas
Minutos
Segundos
Dias
programação
28 h.
de teoria
40 h.
de prática
01
cientista de dados do zero
módulo 1 - O mundo de dados
  • A era da informação
  • Introdução à ciência de dados
  • Introdução a Python
  • Instalação do ambiente
Tarefa: Quiz de fixação e atividade prática – Preparação do ambiente de trabalho pessoal e criar um notebook com células markdown e código simples.
módulo 2 - Fundamentos básicos de Python 1
  • Variáveis
  • Operadores
  • Estruturas básicas de dados
Tarefa: Quiz de fixação e atividade prática – criação de diferentes tipos de variáveis, expressões, estruturas de dados e conversão entre tipos de dados.
módulo 3 - Fundamentos básicos de Python 2
  • Estruturas de decisão e repetição
  • Métodos e funções
  • Módulos e pacotes
  • Introdução à orientação a objetos em Python
  • Tratamento de erros
Tarefa: Quiz de fixação e atividade prática – construção de funções para verificação de números pares; implementação de módulo customizado baseado em uma função que gere números aleatórios empregando métodos de detecção de erros e exceções, por fim criação de classes e atributos.
módulo 4 – Trabalhando com bancos de dados
  • Conexão com banco de dados: SQLite3 e MongoDB
  • Trabalho com banco de dados
  • Leitura e gravação de dados
Tarefa: Quiz de fixação e atividade prática –Quiz de fixação e atividade prática – criação de tabelas de dados com diferentes atributos e registros; e, query de pesquisa e operações nos bancos de dados.
módulo 5 – Bibliotecas: NumPy e pandas
  • Overview sobre as bibliotecas
  • Trabalhando com NumPy
  • Trabalhando com pandas
Tarefa: Quiz de fixação e atividade prática – Quiz de fixação e atividade prática – criação de dataframe com pandas, criação e manipulação de arrays, cálculo de média para variáveis do dataframe, usando função map, aplicação de filtros e criação de função para divisão dos dados.
módulo 6 – Análise e visualização de dados
  • Estatística descritiva: teoria
  • Estatística descritiva: prática
  • Visualização de dados com Matplotlib
Tarefa: Quiz de fixação e atividade prática – exploração da relação entre variáveis usando dois conjuntos de dados diferentes e implementação de gráficos.
módulo 7 – Pré-processamento de dados
  • Preenchimento de dados faltantes
  • Normalização de dados
  • Detecção de outliers
Tarefa: Quiz de fixação e atividade prática – aplicação das técnicas para pré-processamento dos dados, identificação de outliers, aplicação de one-hot-encoding e criação de função para processar o conjunto de dados.
módulo 8 – Fundamentos de machine learning
  • O que é machine learning
  • Principais desafios ao se trabalhar com machine learning
  • Fundamentos básicos de machine learning
Tarefa: Quiz de fixação e atividade prática – escolha da variável alvo, implementação de diferentes modelos para predizer os crimes que acontecem em uma determinada cidade considerando os conjuntos de treino, validação e teste, além do controle sobre o overfitting e underfitting.
módulo 9 – Machine learning na prática
  • Trabalhando em um projeto de data science com machine learning de ponta a ponta
  • Fundamentos de modelos de regressão
Tarefa: Quiz de fixação e atividade prática – extração de informações a partir da análise exploratória seguida do pré-processamento das variáveis, implementação de diferentes modelos de regressão utilizando a validação cruzada e o coeficiente de determinação (R2) como métrica, por fim, criação de gráficos para sumarizar os resultados obtidos.
módulo 10 – Modelos de classificação
  • Principais classificadores
  • Métricas para classificação
  • Análise de resultados
Tarefa: Quiz de fixação e atividade prática – construção de um algoritmo para predição de dígito par ou impar utilizando o conjunto de dados MNIST, diferentes métricas de performance, KNN, validação cruzada e curvas ROC.
módulo 11 – Implementando modelos de machine learning do zero
  • Regressão linear
  • Regressão polinomial
  • Regularização
  • Regressão logísticа
Tarefa: Quiz de fixação e atividade prática – separação do dataset, implementação de modelos de regressão linear e logística considerando a otimização de parâmetros, regularização e modelos polinomiais com scikit-learn.
módulo 12 – Modelos de árvores e ensembles
  • Árvores de decisão
  • Random forest
  • Modelos de boosting
Tarefa: Quiz de fixação e atividade prática – implementação de modelos para predizer o preço de imóveis utilizando o grid-search e diferentes modelos de árvores e ensembles.
módulo 13 – Clusterização
  • Aprendizado não supervisionado
  • K-Means
  • Métricas para K-Means
  • DBSCAN
Tarefa: Quiz de fixação e atividade prática – implementação de clusters RFM (recency, frequency e monetary) para analisar a segmentação de clientes da base de dados a fim de encontrar os clientes mais e menos valiosos.
módulo 14 – Aplicações: detecção de anomalias
  • Fundamentação estatística para a aplicação
  • Modelos não supervisionados para a detecção de anomalias
Tarefa: Quiz de fixação e atividade prática – construção e avaliação de classe para detecção de anomalias testando diferentes modelos (limiares) para melhor descrição dos dados e comparação com modelos de classificação binária para o mesmo tipo de problema.
módulo 15 – Aplicações: sistemas de recomendação
  • Recomendações baseadas nos usuários
  • Recomendações baseadas nos produtos
  • Métricas de avaliação
Tarefa: Quiz de fixação e atividade prática – implementação e avaliação de filtros colaborativos: fatoração matricial.
módulo 16 – Gerenciamento de projetos de dados
  • O que é um projeto de ciência de dados
  • Ciclo de vida de um projeto de ciência de dados
  • Definição das fases de desenvolvimento e deploy de um modelo
  • Boas práticas: organização de arquivos, nomenclatura, documentação e versionamento
  • Monitoramento
Tarefa: Quiz de fixação.
02
cientista de dados PRO
módulo 1 – Importantes tópicos iniciais
  • Introdução a ciência de dados PRO
  • Revisão de tópicos importantes
  • Lidando com o negócio
  • Inteligência Artificial, ética e responsabilidade
  • Cientista e seu ambiente de trabalho
  • Preparando o ambiente para o curso
Tarefa: Leitura e interpretação do artigo “Data Science and the art of persuasion” para ilustrar o terceiro pilar para o cientista de dados: o negócio.
módulo 2 – Introdução às redes neurais I
  • Introdução ao conceito
  • Estrutura de componentes das redes neurais
  • Treinamento de redes neurais
  • Instalação de TensorFlow 2
  • Redes neurais na prática
  • Usando o Tensorboard
Tarefa: identificação e avaliação da composição de uma rede neural aplicada a diferentes tipos de dados através do playground do tensorflow. Implementação de redes neurais com quantidades diferentes de camadas, funções de ativação e número de neurônios.
módulo 3 – Introdução às redes neurais II
  • Voltando à estrutura das redes neurais
  • Tipos de redes
  • Tipos de inicialização e funções de ativação
  • Reutilizando camadas pré-treinadas
  • Aceleração e otimização de redes neurais
  • Tunando hiperparâmetros
  • Regularização
Tarefa: implementação de uma rede neural mais complexa utilizando todas as técnicas vistas durante o módulo.
módulo 4 – Introdução à visão computacional
  • Redes neurais convolucionais para classificação de imagens: introdução às convoluções
  • Segmentação semântica: localização fraca e redes neurais totalmente convolucionais (FCN)
  • Segmentação semântica: arquiteturas avançadas da FCN para segmentação semântica
  • Detecção de objetos: classificação e localização
  • Detecção de objetos: análise e implementação da arquitetura R-CNN
  • Detecção de objetos: análise de arquiteturas populares (Fast/Faster R-CNN, YOLO, SSD)
Tarefa: implementação de uma rede neural usando o R-CNN para classificar todas as subimagens geradas pelo Selective Search.
módulo 5 – Introdução ao aprendizado de representação e Redes Adversárias Generativas
  • Representação de dados
  • Autoencoders
  • Deep autoencoders
  • Autoencoders convolucionais
  • Autoencoders recorrentes
  • Autoencoders variacionais
  • De modelos discriminativos a generativos: transferência de estilo
  • Redes adversárias generativas
Tarefa: implementação dos autoencoders variacionais para base de dados de imagens mais avançada a fim de gerar novos dados para tal base.
módulo 6 – Introdução a séries temporais
  • Conceitos fundamentais
  • Modelos clássicos
  • Prophet – framework do Facebook para forecasting
  • Escalando o Prophet para previsões de grande volume
  • RNN e deep RNNs
  • Lidando com o problema de memória curta com LSTM e GRUs
Tarefa: análise e exploração de dois modelos diferentes para modelar uma serie temporal e o melhor modelo será usado para validar os resultados.
módulo 7 – Introdução ao Processamento de Linguagem Natural (NLP)
  • NLP – conceitos fundamentais
  • NLP e machine learning
  • NLP em redes neurais: redes neurais recorrentes, classificação de texto
  • NLP em redes neurais: modelos de linguagem, atenção, transformador
  • NLU e criação de agentes conversacionais
  • Gerando conteúdo através de NLG
Tarefa: treinar e analisar um modelo de predição de próxima palavra usando N conjuntos de texto diferentes bem como seu comportamento em bases de dados diferentes.
módulo 8 – Introdução ao aprendizado por reforço
  • Conceitos fundamentais
  • Motivação e pesquisa na área
  • Aplicando através do OpenAI Gym
  • Q-Learning
  • Deep Q-Learning
  • Tópicos adicionais
Tarefa: treinar um modelo para que o agente seja capaz de sair do labirinto com o menor número de passos usando o algoritmo Q-Learning e também implemente uma função para retornar o caminho percorrido por ele.
módulo 9 – Redes neurais aplicadas a sistemas de recomendação
  • Conceitos fundamentais
  • Abordagens modernas para a construção de sistemas de recomendação
  • Sistemas de recomendação com base de conhecimento
  • Evoluindo fatoração de matriz
Tarefa: implementação e analise de vetorização de texto para recomendação de conteúdo usando diferentes formas de redução de dimensão, diferentes métodos e fatores, além do cálculo da distância entre os clusteres gerados.
módulo 10 – Modelos em produção
  • Implementação de modelos na produção
  • Documentação
  • Interpretabilidade do modelo
  • Testes A/B: tamanho de amostra e construção de intervalos de confiança
  • Testes A/B: hipóteses estatísticas e algoritmos para testá-las (Bootstrap e teste estatístico)
  • Métricas de desempenho
  • Comunicando o resultado
  • Servindo o modelo
  • Monitoramento, relatórios e dashboards
Tarefa: gerar uma estrutura de dados com dois modelos diferentes, seguido pela implementação de uma API local com rota para os dois modelos contendo toda documentação detalhada.
módulo 11 – Bônus: introdução a big data com Databricks e PySpark
  • Principais conceitos de big data e Spark
  • Por que usar Spark no Databricks
  • Criando acesso ao Databricks CE
  • Utilizando as funções Databricks
  • Utilizando PySpark dentro do Databricks
  • Principais funções de PySpark
  • Usando joins no PySpark
Inscreva-se no curso
Garanta seu desconto e nós entraremos em contato
R$ 221,25*
Até 12 vezes de
*Crédito sujeito à aprovação pelo parceiro financeiro com incidência de juros.
preço total sem desconto
R$ 2.655,00
preço total a vista
R$ 5.900,00
Cientista de dados do zero ao PRO
Days
Hours
Minutes
Seconds
Escola online das profissões mais procuradas
Av. Brg. Faria Lima, 2369 - São Paulo -SP
© Mentorama, 2020-2021 | CNPJ: 36.860.664/0001-78