50%
a promoção termina em:investimento
formas de pagamento
programa de Crédito Estudantil
explore redes neurais, aprendizado de máquina e Python na prática e torne-se um cientista de dados em apenas 8 meses
programa de Crédito Estudantil
trabalhamos constantemente na modernização dos nossos cursos para que você receba sempre os conteúdos mais recentes do mercado.
estes profissionais são responsáveis pela coleta, organização e análise de uma grande quantidade de dados para transformá-los em insights e informações valiosas para as empresas. Eles buscam por ordem e padrões nos dados, com o objetivo de identificar tendências que impactam o retorno financeiro das empresas.
vagas abertas no LinkedIn Brasil
média salarial segundo o Glassdoor
contratam constantemente para essa área
a área de Ciência de Dados está em plena ascensão e seus profissionais são muito bem remunerados, pois agregam valor às empresas ao fornecer informações claras e úteis que compreendem tanto situações passadas quanto previsões do futuro.
veja a faixa salarial da sua futura profissão:
*FONTE: GLASSDOOR
júnior
com até 2 anos de experiência
pleno
com até 4-5 anos de experiência
sênior
com mais de 5 anos de experiência
você já tem experiência e quer se aprimorar na área de tecnologia? No curso, você aprenderá como obter o máximo de grandes conjuntos de dados, testar hipóteses e fazer previsões rapidamente.
você trabalha como programador, mas deseja crescer profissionalmente? Este curso fornecerá a base necessária para a transição para ciência de dados e análise de Big Data.
se você sonha com uma profissão super procurada no mercado, com altos salários e potencial de crescimento, a ciência de dados é uma ótima opção.
aprenda a sintaxe do Python e saiba como escrever um código conciso que qualquer desenvolvedor possa entender.
entenda a diferença de bancos de dados relacionais e não relacionais. Seja capaz de gerenciar grandes quantidades de dados.
domine os métodos de depuração e teste. Encontre e corrija o menor erro em seu próprio código ou no código de outra pessoa.
domine a programação orientada a objetos e seja capaz de desenvolver programas modulares.
aprenda a trabalhar com um sistema de controle de versão distribuído - faça alterações em um projeto simultaneamente com outros desenvolvedores.
familiarize-se com a interação cliente-servidor, domine solicitações GET e POST. Integre novas aplicações com API
mentores experts disponíveis para corrigir tarefas, dar feedback, indicar materiais de apoio e compartilhar dicas da área.
no chat, você poderá compartilhar materiais de apoio e se comunicar com outros alunos. Além disso, os mentores também estarão presentes para tirar dúvidas e dar conselhos sobre as tarefas.
sabemos que não é fácil colocar em prática novos conhecimentos, por isso estamos à disposição para te ajudar ❤️
acesse o conteúdo quando e onde quiser. Assista às aulas, faça tarefas e receba feedback dos mentores diretamente no seu celular
aprenda
com os experts
do mercado
mentorias individuais com os profissionais mais experientes e que atuam nas mais importantes companhias de suas áreas
• A era da informação
• Introdução à Ciência de Dados
• Introdução ao Python
• Instalação do ambiente
Tarefa: Quiz de fixação e atividade prática – Preparação do ambiente de trabalho pessoal e criação de um notebook com células markdown e código simples.
• Variáveis
• Operadores
• Estruturas básicas de dados
Tarefa: Quiz de fixação e atividade prática – criação de diferentes tipos de variáveis, expressões, estruturas de dados e conversão entre tipos de dados.
• Estruturas de decisão e repetição
• Métodos e funções
• Módulos e pacotes
• Introdução à orientação a objetos em Python
• Tratamento de erros
Tarefa: Quiz de fixação e atividade prática – construção de funções para verificação de números pares; implementação de módulo customizado baseado em uma função que gere números aleatórios empregando métodos de detecção de erros e exceções, por fim criação de classes e atributos.
• Conexão com banco de dados: SQLite3 e MongoDB
• Trabalho com banco de dados
• Leitura e gravação de dados
Tarefa: Quiz de fixação e atividade prática – criação de tabelas de dados com diferentes atributos e registros. Query de pesquisa e operações nos bancos de dados.
• Overview sobre as bibliotecas
• Trabalhando com NumPy
• Trabalhando com pandas
Tarefa: Quiz de fixação e atividade prática – Quiz de fixação e atividade prática – criação de dataframe com pandas, criação e manipulação de arrays, cálculo de média para variáveis do dataframe, usando função map, aplicação de filtros e criação de função para divisão dos dados.
• Estatística descritiva: teoria
• Estatística descritiva: prática
• Visualização de dados com Matplotlib
Tarefa: Quiz de fixação e atividade prática – exploração da relação entre variáveis usando dois conjuntos de dados diferentes e implementação de gráficos.
• Preenchimento de dados faltantes
• Normalização de dados
• Detecção de outliers
Tarefa: Quiz de fixação e atividade prática – aplicação das técnicas para pré-processamento dos dados, identificação de outliers, aplicação de one-hot-encoding e criação de função para processar o conjunto de dados.
• O que é machine learning
• Principais desafios ao se trabalhar com machine learning
• Fundamentos básicos de machine learning
Tarefa: Quiz de fixação e atividade prática – escolha da variável alvo, implementação de diferentes modelos para predizer os crimes que acontecem em uma determinada cidade considerando os conjuntos de treino, validação e teste, além do controle sobre o overfitting e underfitting.
• Trabalhando em um projeto de data science com machine learning de ponta a ponta
• Fundamentos de modelos de regressão
Tarefa: Quiz de fixação e atividade prática – extração de informações a partir da análise exploratória seguida do pré-processamento das variáveis, implementação de diferentes modelos de regressão utilizando a validação cruzada e o coeficiente de determinação (R2) como métrica e, por fim, criação de gráficos para sumarizar os resultados obtidos.
• Principais classificadores
• Métricas para classificação
• Análise de resultados
Tarefa: Quiz de fixação e atividade prática – construção de um algoritmo para predição de dígito par ou ímpar utilizando o conjunto de dados MNIST, diferentes métricas de performance, KNN, validação cruzada e curvas ROC.
• Regressão linear
• Regressão polinomial
• Regularização
• Regressão logísticа
Tarefa: Quiz de fixação e atividade prática – separação do dataset, implementação de modelos de regressão linear e logística considerando a otimização de parâmetros, regularização e modelos polinomiais com scikit-learn.
• Introdução à ciência de dados PRO
• Revisão de tópicos importantes
• Lidando com o negócio
• Inteligência Artificial, ética e responsabilidade
• Cientista e seu ambiente de trabalho
• Preparando o ambiente para o curso
Tarefa: Leitura e interpretação do artigo “Data Science and the art of persuasion” para ilustrar o terceiro pilar para o cientista de dados: o negócio.
• Introdução ao conceito
• Estrutura de componentes das redes neurais
• Treinamento de redes neurais
• Instalação de TensorFlow 2
• Redes neurais na prática
• Usando o Tensorboard
Tarefa: identificação e avaliação da composição de uma rede neural aplicada a diferentes tipos de dados através do playground do tensorflow. Implementação de redes neurais com quantidades diferentes de camadas, funções de ativação e número de neurônios.
• Voltando à estrutura das redes neurais
• Tipos de redes
• Tipos de inicialização e funções de ativação
• Reutilizando camadas pré-treinadas
• Aceleração e otimização de redes neurais
• Tunando hiperparâmetros
• Regularização
Tarefa: implementação de uma rede neural mais complexa utilizando todas as técnicas vistas durante o módulo.
• Redes neurais convolucionais para classificação de imagens: introdução às convoluções
• Segmentação semântica: localização fraca e redes neurais totalmente convolucionais (FCN)
• Segmentação semântica: arquiteturas avançadas da FCN para segmentação semântica
• Detecção de objetos: classificação e localização
• Detecção de objetos: análise e implementação da arquitetura R-CNN
• Detecção de objetos: análise de arquiteturas populares (Fast/Faster R-CNN, YOLO, SSD)
Tarefa: implementação de uma rede neural usando o R-CNN para classificar todas as subimagens geradas pelo Selective Search.
• Representação de dados
• Autoencoders
• Deep autoencoders
• Autoencoders convolucionais
• Autoencoders recorrentes
• Autoencoders variacionais
• De modelos discriminativos a generativos: transferência de estilo
• Redes adversárias generativas
Tarefa: implementação dos autoencoders variacionais para base de dados de imagens mais avançada a fim de gerar novos dados para tal base.
• Árvores de decisão
• Random forest
• Modelos de boosting
Tarefa: Quiz de fixação e atividade prática – implementação de modelos para predizer o preço de imóveis utilizando o grid-search e diferentes modelos de árvores e ensembles.
• Aprendizado não supervisionado
• K-Means
• Métricas para K-Means
• DBSCAN
Tarefa: Quiz de fixação e atividade prática – implementação de clusters RFM (recency, frequency e monetary) para analisar a segmentação de clientes da base de dados a fim de encontrar os clientes mais e menos valiosos.
• Fundamentação estatística para a aplicação
• Modelos não supervisionados para a detecção de anomalias
Tarefa: Quiz de fixação e atividade prática – construção e avaliação de classe para detecção de anomalias testando diferentes modelos (limiares) para melhor descrição dos dados e comparação com modelos de classificação binária para o mesmo tipo de problema.
• Recomendações baseadas nos usuários
• Recomendações baseadas nos produtos
• Métricas de avaliação
Tarefa: Quiz de fixação e atividade prática – implementação e avaliação de filtros colaborativos: fatoração matricial.
• O que é um projeto de ciência de dados
• Ciclo de vida de um projeto de ciência de dados
• Definição das fases de desenvolvimento e deploy de um modelo
• Boas práticas: organização de arquivos, nomenclatura, documentação e versionamento
• Monitoramento
Tarefa: Quiz de fixação.
• Conceitos fundamentais
• Modelos clássicos
• Prophet – framework do Facebook para forecasting
• Escalando o Prophet para previsões de grande volume
• RNN e deep RNNs
• Lidando com o problema de memória curta com LSTM e GRUs
Tarefa: análise e exploração de dois modelos diferentes para modelar uma série temporal e o melhor modelo será usado para validar os resultados.
• NLP – conceitos fundamentais
• NLP e machine learning
• NLP em redes neurais: redes neurais recorrentes, classificação de texto
• NLP em redes neurais: modelos de linguagem, atenção, transformador
• NLU e criação de agentes conversacionais
• Gerando conteúdo através de NLG
Tarefa: treinar e analisar um modelo de predição de próxima palavra usando N conjuntos de texto diferentes bem como seu comportamento em bases de dados diferentes.
• Conceitos fundamentais
• Motivação e pesquisa na área
• Aplicando através do OpenAI Gym
• Q-Learning
• Deep Q-Learning
• Tópicos adicionais
Tarefa: treinar um modelo para que o agente seja capaz de sair do labirinto com o menor número de passos usando o algoritmo Q-Learning e também implemente uma função para retornar o caminho percorrido por ele.
• Conceitos fundamentais
• Abordagens modernas para a construção de sistemas de recomendação
• Sistemas de recomendação com base de conhecimento
• Evoluindo fatoração de matriz
Tarefa: implementação e analise de vetorização de texto para recomendação de conteúdo usando diferentes formas de redução de dimensão, diferentes métodos e fatores, além do cálculo da distância entre os clusteres gerados.
Implementação de modelos na produção
Documentação
• Interpretabilidade do modelo
• Testes A/B: tamanho de amostra e construção de intervalos de confiança
• Testes A/B: hipóteses estatísticas e algoritmos para testá-las (Bootstrap e teste estatístico)
• Métricas de desempenho
• Comunicando o resultado
• Servindo o modelo
• Monitoramento, relatórios e dashboards
Tarefa: gerar uma estrutura de dados com dois modelos diferentes, seguido pela implementação de uma API local com rota para os dois modelos contendo toda documentação detalhada.
• Principais conceitos de big data e Spark
• Por que usar Spark no Databricks
• Criando acesso ao Databricks CE
• Utilizando as funções Databricks
• Utilizando PySpark dentro do Databricks
• Principais funções de PySpark
• Usando joins no PySpark
mestre em matemática pura сom vasta experiência na área de ciência de dados. Já trabalhou em consultorias, empresas tradicionais e startups.
mestre em matemática pura e praticante de ciência de dados desde 2016. Possui grande experiência como cientista, atualmente atua como data science manager na Wildlife Studios.
mestre em Estatística pela Universidade Federal do Rio de Janeiro (UFRJ). Atualmente, é gerente de Ciência de Dados no iFood.
formada em Ciências Estatísticas pela Universidade Federal do Rio de Janeiro (UFRJ) e hoje atua como cientista de dados na Gupy.
confirma que você concluiu o curso e é uma vantagem adicional ao se candidatar a uma vaga de emprego.
programa de Crédito Estudantil
ao finalizar o curso eu recebo um certificado de conclusão?
sim. Após entregar todas as tarefas e finalizar o curso, você recebe um certificado de conclusão.
quais são os requisitos técnicos necessários para fazer o curso?
você vai precisar apenas de internet com boa conexão. As instruções de download e instalação para ambos estão incluídas no curso.
como funciona o curso?
todo o curso é conduzido de forma individual. Os professores corrigem as tarefas e dão dicas de como melhorar o trabalho. Você também pode fazer qualquer pergunta ao mentor no chat ou conversar com o seu grupo.
é possível pular os módulos?
no final de todo módulo, há uma tarefa prática. Ao resolvê-la, você liberará o próximo módulo. Essa metodologia garante que você tenha motivação para continuar a estudar e nós garantimos que você cumpra todas as tarefas necessárias.
qual é a carga horária? É possível combinar com o trabalho?
todo o formato do curso é feito para que você possa combinar com trabalho, estudo e vida pessoal. Você pode estudar em qualquer horário, no seu próprio ritmo. Além disso, todas as lições estarão disponíveis por dois anos.
eu posso me comunicar com os mentores?
no chat, você terá acesso a um instrutor que dará feedback e dicas em suas atividades. Você terá a chance de aprender com as experiências dos nossos mentores, que são líderes em suas áreas.
e se eu precisar de apenas uma parte do curso?
o curso é dividido em duas partes. Se você conferiu o programa e percebeu que precisa de uma delas, poderá pagar apenas por ela. Para isso, deixe seu pedido e diga ao gerente o seu desejo.