Skip to main content

IPLUSO 15430

Data Mining

Gestão de Sistemas de Informação (T) (IPLUSO)
  • ApresentaçãoPresentation
    A disciplina de Data Mining tem como objetivo fundamental dar ao estudante competências na transformação de dados em informação de suporte às decisões, no contexto de grandes bases de dados.  As ferramentas de Data Mining têm como objetivo a identificação de comportamentos e tendências futuras, suportando o processo de decisão pró-ativo e fundamentado no conhecimento. Podem também responder a perguntas de negócios cuja solução, tradicionalmente, era muito complexa do ponto de vista computacional.  Assim, esta disciplina trata dos temas e questões normalmente associados às designações de Data Mining ou Descoberta de Conhecimento. Neste curso, serão apresentados os principais aspetos metodológicos do Data Mining bem como as mais importantes ferramentas utilizadas. A componente prática é um dos aspetos fundamentais da disciplina, pelo que a capacidade de traduzir conhecimento em ações práticas e decisões de análise é particularmente valorizada.
  • ProgramaProgramme
    1. Introdução ao Data Mining (6h) - Conceitos fundamentais: o que é Data Mining - Diferenças entre Data Mining, Big Data, Business Intelligence e Machine Learning - O processo de Knowledge Discovery in Databases (KDD) - Casos de uso reais em várias áreas (saúde, retalho, finanças, etc.) 2. Preparação e Exploração de Dados (6h) - Tipos de dados e qualidade dos dados - Limpeza, transformação e normalização - Análise exploratória: estatísticas básicas, histogramas, boxplots - Técnicas de amostragem 3. Técnicas de Exploração de Dados – Parte I (21h) 3.1 Classificação e Regressão (9h) 3.2 Agrupamento (Clustering) (6h) 3.3 Regras de Associação (6h) 4. Validação e Avaliação de Modelos (6h) - Divisão treino/teste, validação cruzada - Overfitting e underfitting - Confusion Matrix, curvas ROC/AUC 5. Ferramentas e Fluxos de Trabalho em Data Mining (6h) - Apresentação de ferramentas gráficas: KNIME, RapidMiner, Orange - Criação de pipelines visuais de Data Mining - Integração com fontes de dados externas
  • ObjectivosObjectives
    Esta unidade curricular visa abordar o processo de descoberta de conhecimento em bases de dados e as metodologias mais comuns no Data Mining; Pretende-se que os alunos entendam as possíveis tarefas do Data Mining, designadamente a classificação, previsão, análise de tendências (séries temporais), agrupamento, sumarização (e visualização) ou associação; Pretende-se ainda abordar um conjunto de técnicas geralmente usadas na implementação do Data Mining, como árvores de decisão, regras de associação, regressão linear, redes neuronais artificiais, algoritmos genéticos ou redes de Bayes; Outro importante objetivo consiste na utilização de uma plataforma online de aplicação dos conhecimentos teóricos.
  • BibliografiaBibliography
    Han, J., Kamber, M., Pei, J. (2012). Data Mining - Concepts and Techniques, Elsevier Gama, J., at al (2017). Extração de conhecimento de Dados – Data Mining. Edições Sílabo
  • MetodologiaMethodology
    Uso de aplicações/ferramentas/plataformas disgitais de apoio ao processo de aprendizagem, tais como: - Microsoft Power BI - SAS Viya for Learners - Linguagem Python - Knime, RapideMiner, Orange
  • LínguaLanguage
    Português
  • TipoType
    Semestral
  • ECTS
    5
  • NaturezaNature
    Obrigatório
  • EstágioInternship
    Não