Informações administrativas
Titulo | Preparação e exploração de dados |
Duração | 60 |
Módulo | A |
Tipo de aula | Palestra |
Foco | Prático — Modelação de IA |
Tópico | Métodos de preparação de dados |
Palavras-chave
Preparação de dados, Limpeza de Dados, Transformação de Dados, Normalização de Dados, Integração de Dados, Redução de Dados,
Objetivos de aprendizagem
- Para poder escolher o método de preparação de dados mais adequado com base no caso
- preparar dados na prática (mandar valores em falta, criar novas funcionalidades derivadas)
- Enriquecimento de dados
- Ética: anonimização e problemas com isto (identificação possível de formas indiretas) — mais uma vez, deve haver alguns exemplos lá fora
- Imputação — mencionar que pode introduzir preconceitos e que tal deve ser tido em conta
- Criação de novas funcionalidades — perda de semântica adequada
- Ética: remover o viés do conjunto de dados
- Paralelos e diferenças entre a amostragem de dados nas estatísticas e a aquisição de dados (incluindo megadados) para o BC e a IA
Preparação prevista
Eventos de aprendizagem a serem concluídos antes
Obrigatório para os Estudantes
- N/A
Facultativo para Estudantes
- N/A
Referências e antecedentes para estudantes
- N/A
Recomendado para professores
Materiais das aulas
Instruções para os professores
Podes basear esta aula à volta dos slides.
Esboço
Duração (min) | Descrição | Conceitos | |
---|---|---|---|
5 | Esboço | Métodos de preparação de dados: qual é o objetivo? | |
5 | Problemas/Pré-processamento | Que problemas podem ter os dados, limpeza, purificação | |
5 | Preparação de dados | Limpeza, transformação, integração, normalização, imputação, identificação do ruído | |
5 | Preparação dos dados em pormenor | Formas de preparação de dados | |
10 | Limpeza de dados em pormenor | Correção ou remoção de dados incorretos, corrompidos, formatados incorretamente, duplicados ou incompletos num conjunto de dados | |
10 | Transformação de dados em pormenor | Converter dados de um formato para outro, boas práticas. | |
5 | Normalização dos dados em pormenor | Boas práticas de normalização de dados. | |
5 | Integração de dados em pormenor | Boas práticas de integração de dados. | |
5 | Redução de dados em pormenor | Melhores práticas de redução de dados. | |
10 | Preparação de dados na prática | Filtragem, valores em falta, duplicados, | |
5 | Observações finais | Enfatizar a importância da preparação de dados. |
Agradecimentos
O programa de mestrado em IA centrado no ser humano foi cofinanciado pelo Mecanismo Interligar a Europa da União Europeia ao abrigo de subvenções CEF-TC-2020-1 Competências Digitais 2020-EU-IA-0068.