Informações administrativas
Titulo | Análise exploratória dos dados |
Duração | 60 |
Módulo | A |
Tipo de aula | Palestra |
Foco | Técnico — Fundamentos da IA |
Tópico | Análise exploratória dos dados |
Palavras-chave
Exploração de dados, T-SNE, PCA,
Objetivos de aprendizagem
- O aluno conhece os tipos básicos de gráfico e sabe quando usá-los.
- O aluno pode usar visualizações para investigar uma distribuição de variáveis.
- O aluno pode verificar se há dependências entre variáveis utilizando a visualização.
- O aluno é capaz de visualizar um conjunto de dados de alta dimensão usando PCA e T-SNE.
Preparação prevista
Eventos de aprendizagem a serem concluídos antes
Nenhuma.
Obrigatório para os Estudantes
- Leia o blog Utilizar o T-SNE no Python para visualizar conjuntos de dados de alta dimensão (alternativa)
- Leia o capítulo 4 do Manual Python Data Science
Facultativo para Estudantes
Nenhuma.
Referências e antecedentes para estudantes
Nenhuma.
Recomendado para professores
- Sobre a visualização de conjuntos de dados de alta dimensão: Utilização de T-SNE em Python
- Capítulo 4 do Manual Python Data Science
Materiais das aulas
Instruções para os professores
Esta palestra centra-se na visualização de dados como parte do processo de Análise de Dados Exloratórios (EDA). Portanto, não abrange a visualização de dados para, por exemplo, contar histórias e apresentações.
Tópicos a serem abordados
- Introdução à visualização de dados (5 min)
- Objetivos das visualizações de dados (EDA, storytelling)
- Qual o gráfico a utilizar para que problema (15 min)
- Tipos de gráficos e sua utilização
- Como escolher o gráfico certo
- O Do’s e o Dont’s
- Verificar se há variáveis (in)dependentes (10 min)
- Visualização de dados de alta dimensão (20 min)
- APC
- T-SNE
Agradecimentos
O programa de mestrado em IA centrado no ser humano foi cofinanciado pelo Mecanismo Interligar a Europa da União Europeia ao abrigo de subvenções CEF-TC-2020-1 Competências Digitais 2020-EU-IA-0068.