Neste curso abordam-se técnicas de Data Science, que permitem extrair informação e obter insigths relevantes a partir deles. O foco principal do curso é na análise de dados, abordando-se também a etapa de criação, importação e preparação dos dados.
O desenvolvimento de modelos preditivos assume um papel de destaque em Science e, em particular, em Machine Learning, cujo objetivo é treinar máquinas para aprender com dados. Neste curso, aplicam-se técnicas que permitem desenvolver modelos de scoring e de clustering, numa abordagem baseada em casos práticos em R.
ES702 – Data Science com R e RStudio
Após realizarem este curso, os formandos devem ser capazes de:
1 – Conhecer as ferramentas e princípios básicos inerentes à recolha, tratamento e análise de dados e à apresentação de resultados.
2 – Representar dados através de tabelas, gráficos e medidas descritivas com recurso ao R;
3 – Construir intervalos de confiança e realizar testes de hipóteses no R;
4 – Aplicar técnicas análise de correlações e de redução de dimensionalidade de dados no R;
5 – Aplicar técnicas hierárquicas e não hierárquicas de análise de clusters no R;
6 – Distinguir e comparar técnicas de aprendizagem supervisionada, em tarefas de classificação e de regressão;
7 – Ajustar modelos de aprendizagem supervisionada aos dados no R e utilizá-los para fins preditivos;
8 – Avaliar e comparar o desempenho de modelos de aprendizagem supervisionada.
Currículo do Curso
Seção 1 - Apresentação | |||
Apresentação do curso ES702 | 00:00:00 | ||
Apresentação da professora Sílvia Pedro | GRÁTIS | 00:05:00 | |
Instruções do curso ES302 | 00:00:00 | ||
Seção 2 - Fundamentos de Data Science | |||
O que é Data Science? | 00:00:00 | ||
O que faz um Data Scientist? | 00:00:00 | ||
Equipa de Data Science | 00:00:00 | ||
Machine Learning: aprendendo com dados | 00:00:00 | ||
Seção 3 - Introdução ao R | |||
Ambiente e instalação do R | 00:07:00 | ||
Ambiente e instalação RStudio | 00:07:00 | ||
Pacotes do R | 00:08:00 | ||
ES100Q1 QUESTIONÁRIO | 00:20:00 | ||
Seção 4 - Operações e objetos elementares no R | |||
Operações matemáticas | 00:13:00 | ||
Vetores e listas | 00:22:00 | ||
Matrizes | 00:10:00 | ||
Seleção de elementos de uma matriz | 00:04:00 | ||
Operações envolvendo matrizes | 00:15:00 | ||
ES100Q2 QUESTIONÁRIO | 00:50:00 | ||
Seção 5 - Bases de dados | |||
Criação e importação de bases de dados | 00:15:00 | ||
Valores omissos | 00:11:00 | ||
ES100Q3 QUESTIONÁRIO | 00:30:00 | ||
Seção 6 - Introdução à Estatística | |||
Conceitos básicos de Estatística | GRÁTIS | 00:29:00 | |
Tipos de variáveis | 00:00:00 | ||
Classificação de variáveis no R | 00:14:00 | ||
ES101Q01 QUESTIONÁRIO | 00:40:00 | ||
Seção 7 - Preparação dos dados | |||
Manuseamento e transformações nos dados | 00:09:00 | ||
Manipulação de datas | 00:14:00 | ||
Seção 8 - Visualização dos dados em tabelas e gráficos | |||
Tabelas de frequências | 00:28:00 | ||
Tabelas de contingência | 00:19:00 | ||
Representações gráficas | 00:35:00 | ||
ES101Q02 QUESTIONÁRIO | 00:20:00 | ||
Seção 9 - Medidas descritivas | |||
Medidas de localização no R | 00:37:00 | ||
Medidas de dispersão no R | 00:37:00 | ||
Medidas de assimetria e curtose no R | 00:15:00 | ||
Análises descritivas por grupos | 00:13:00 | ||
ES101Q03 QUESTIONÁRIO | 00:40:00 | ||
Seção 10 - Fundamentos de Estatística Inferencial | |||
Introdução à estatística inferencial | 00:05:00 | ||
Métodos de amostragem | 00:19:00 | ||
Testes de hipóteses | 00:07:00 | ||
Intervalos de confiança | 00:13:00 | ||
QUESTIONARIOS: ES102Q01 | 00:20:00 | ||
Seção 11 - Inferências sobre a média populacional | |||
Distribuição amostral da média | 00:07:00 | ||
Normalidade e Teorema do Limite Central | 00:06:00 | ||
Ilustração do Teorema do Limite Central no R | 00:10:00 | ||
Intervalo de confiança para a média populacional | 00:07:00 | ||
Teste de hipóteses para a média populacional | 00:10:00 | ||
Teste de hipóteses para a média populacional no R | 00:05:00 | ||
Seção 12 - Testes para comparação de amostras independentes | |||
Teste t para amostras independentes | 00:20:00 | ||
Teste t para amostras independentes no R | 00:15:00 | ||
Teste não paramétrico de Mann-Whitney no R | 00:16:00 | ||
Análise de Variância | 00:13:00 | ||
Análise de Variância no R | 00:07:00 | ||
Testes de comparações múltiplas no R | 00:04:00 | ||
Verificação do pressuposto de homocedasticidade no R | 00:04:00 | ||
Alternativas no caso de heterocedasticidade no R | 00:03:00 | ||
Verificação do pressuposto de normalidade no R | 00:04:00 | ||
Teste não paramétrico de Kruskal-Wallis no R | 00:04:00 | ||
QUESTIONARIOS: ES102Q02 | 00:20:00 | ||
QUESTIONARIOS: ES102Q03 | 00:20:00 | ||
Seção 13 - Testes para comparação de amostras emparelhadas | |||
Teste t para amostras emparelhadas | 00:14:00 | ||
Teste t para amostras emparelhadas no R | 00:14:00 | ||
Teste não paramétrico dos sinais no R | 00:10:00 | ||
Teste não paramétrico de Wilcoxon no R | 00:11:00 | ||
ANOVA de medidas repetidas no R | 00:15:00 | ||
Teste de Friedman no R | 00:07:00 | ||
QUESTIONARIOS: ES102Q04 | 00:15:00 | ||
QUESTIONARIOS: ES102Q05 | 00:10:00 | ||
Seção 14 - Análise de associações | |||
Teste de independência do Qui-Quadrado de Pearson | 00:15:00 | ||
Teste de independência do Qui-Quadrado de Pearson no R | 00:17:00 | ||
QUESTIONARIOS: ES102Q06 | 00:20:00 | ||
Seção 15 - Análise de correlação linear | |||
Relações entre variáveis quantitativas | 00:13:00 | ||
Correlação linear | 00:15:00 | ||
Correlação linear no R | 00:08:00 | ||
Matriz de correlações e sua representação gráfica no R | 00:06:00 | ||
Teste de significância do coeficiente de correlação linear de Pearson no R | 00:05:00 | ||
Coeficientes de correlação não paramétricos no R | 00:07:00 | ||
ES103Q01 QUESTIONÁRIO | 00:25:00 | ||
Seção 16 - Modelo preditivo de regressão linear simples | |||
Modelo de regressão linear simples (RLS) | 00:09:00 | ||
Estimação dos coeficientes do modelo de RLS pelo Método dos Mínimos Quadrados | 00:14:00 | ||
Avaliação da qualidade do modelo de RLS | 00:16:00 | ||
Modelo de RLS no R | 00:08:00 | ||
Valores preditos pelo modelo de RLS no R | 00:04:00 | ||
Cálculos para avaliação da qualidade do ajustamento do modelo de RLS no R | 00:05:00 | ||
Diagnóstico do modelo de RLS no R | 00:13:00 | ||
Validação de um modelo de regressão linear no R | 00:12:00 | ||
ES103Q02 QUESTIONÁRIO | 00:15:00 | ||
Seção 17 - Modelo preditivo de Regressão Linear Múltipla | |||
Modelo de regressão linear múltipla (RLM) | 00:15:00 | ||
Modelo de RLM no R | 00:14:00 | ||
Variáveis independentes qualitativas num modelo de RLM: Exemplo em R | 00:17:00 | ||
Introdução à análise de diagnóstico | 00:01:00 | ||
Linearidade da equação de regressão e homocedasticidade dos resíduos | 00:05:00 | ||
Normalidade dos resíduos | 00:02:00 | ||
Independência dos resíduos | 00:02:00 | ||
Identificação de outliers | 00:18:00 | ||
Ausência de multicolinearidade | 00:08:00 | ||
Recurso ao stepwise para encontrar um bom modelo | 00:14:00 | ||
Diagnóstico do modelo encontrado com o stepwise | 00:07:00 | ||
Exclusão de outliers | 00:08:00 | ||
Validação do modelo | 00:03:00 | ||
ES103Q03 QUESTIONÁRIO | 00:25:00 | ||
ES103Q04 QUESTIONÁRIO | 00:25:00 | ||
ES103Q05 QUESTIONÁRIO | 00:10:00 | ||
ES103 Script em R | 02:00:00 | ||
Seção 18 - Métodos de classificação supervisionada (scoring) | |||
Avaliação de desempenho de um modelo de classificação | 00:09:00 | ||
Procedimentos de treino e teste | 00:00:00 | ||
Seção 19 - Modelo preditivo de regressão logística | |||
Modelo de Regressão Logística | 00:14:00 | ||
Estimação dos coeficientes do modelo de regressão logística | 00:09:00 | ||
Interpretação dos coeficientes do modelo de Regressão Logística | 00:05:00 | ||
Significância e capacidade de ajustamento do modelo de Regressão logística | 00:08:00 | ||
Regressão logística no R | 00:00:00 | ||
Seção 20 - Modelos preditivos baseados em árvores | |||
Introdução às Árvores de Classificação e Regressão (CART) | 00:00:00 | ||
Nós e regras de divisão | 00:00:00 | ||
Descrição do método (para classificação) | 00:00:00 | ||
Exemplo de aplicação no R (para classificação) | 00:00:00 | ||
Descrição do método (para regressão) | 00:00:00 | ||
Exemplo de aplicação no R (para regressão) | 00:00:00 | ||
Random Forest | 00:00:00 | ||
Random Forest no R | 00:00:00 | ||
Seção 21 - Redes neuronais | |||
Introdução às redes neuronais | 00:00:00 | ||
Perceptrão | 00:00:00 | ||
Redes neuronais no R | 00:00:00 | ||
Seção 22 - Métodos de classificação não supervisionada (clustering) | |||
Introdução à análise de clusters | 00:00:00 | ||
Medidas de dissemelhança | 00:00:00 | ||
Métodos de aglomeração hierárquicos e suas etapas | 00:00:00 | ||
Dendograma | 00:00:00 | ||
Clustering hierárquico no R | 00:00:00 | ||
Clustering não hierárquico: Método das k médias | 00:00:00 | ||
Clustering não hierárquico: Método CLARA (Clustering Large Applications) | 00:00:00 | ||
Clustering não hierárquico no R | 00:00:00 | ||
Seção 23 - Análise Fatorial Exploratória | |||
Introdução à Análise Fatorial Exploratória (AFE) | 00:11:00 | ||
Avaliação da adequação da AFE aos dados | 00:08:00 | ||
Métodos de estimação dos fatores na AFE | 00:09:00 | ||
Critérios de escolha do número de fatores na AFE | 00:08:00 | ||
Métodos de rotação dos fatores na AFE | 00:03:00 | ||
AFE no R | 00:00:00 | ||
Seção 24 - Bancos de dados | |||
Dados utilizados no curso ES702 | 00:00:00 | ||
Seção 25 - Referências | |||
Referências bibliográficas ES702 | 00:00:00 | ||
Seção 26 - Projeto aplicado de Data Science | |||
Projeto aplicado de Data Science com R | 16:00:00 |
Avaliações do Curso
Nenhuma avaliação foi encontrada para este curso.