Disciplina: INE5644 –Data Mining 

Horário: Terças e quintas às 18:30 

Professora Vania Bogorny

Horário de atendimento: 

Terças-feiras: 16h:17h

Quintas-feiras das 16h as 17h

 

Objetivo Geral:

Apresentar e aplicar as principais técnicas de mineração de dados e o processo de KDD com vistas à

identificação de padrões importantes e não óbvios em grandes bancos de dados. A bibliografia da disciplina encontra-se no final desta página.

 

Avaliação:

 

A Média Final será calculada pela fórmula:  (P1*0.35 + P2*0.35 + TA*0.10 + TP*0.2), onde

P1 = Prova 1 (individual)
P2 = Prova 2 (individual)
TA = Trabalhos Realizados em aula
TP = Trabalho Prático (em grupo)

 

Os trabalhos em aula (TA) serão realizados durante as aulas, durante todo o semestre.


O trabalho prático (TP) será entregue em etapas, impresso, conforme segue:


Parte 1) Definição do Problema de data mining, entendimento dos dados, objetivo da mineração de dados 
Parte 2) Aplicação da metodologia crisp-DM, incluindo todas as etapas de pré-processamento, seleção dos atributos para mineração, normalização e discretização, seleção do conjunto de registros (filtro dos anos) a serem usados no processo de mineração, Estatísticas (histogramas) de cada atributo usado no processo e análise da relevância do mesmo
Parte 3) Mineração de Dados, Análise dos resultados, e relevância e justificativa dos resultados encontrados.
 

 

A nota do trabalho prático será composta pela nota do relatório final (texto escrito, 70%), pela nota da apresentação oral (20%) e a nota da avaliação realizada sobre a apresentação dos demais grupos (10%).

 

Cronograma 

Aula 

Data

Conteúdo

Aula 1

Março

12

Apresentação da disciplina e Tarefas de data mining

Aula 2

14

O processo de KDD  

Aula 3

19

Análise dos dados (Pré-Processamento) 

Aula 4

21

Trabalho em Aula

Aula 5

26

Aula Prática: A ferramenta WEKA

Definição do Trabalho Prático + Grupos

Definição e Discussão dos objetivos do trabalho Prático (Discussão sobre a Parte 1 do Trabalho Prático)

Aula 6

28

Classificação: conceitos básicos e árvores de decisão 

 

 

 

Aula 7

Abril

2

Classificação: avaliação

Aula 8

4

Classificação: outros algoritmos 

Aula 9

9

Classificação: Trabalho em Aula 

Aula 10

11

Distância e Similaridade: 

Aula 11

16

Aula prática Exercícios  dados

Aula 12

18

(Entrega e apresentação da Parte 1 do Trabalho Prático - 5 minutos por grupo)

Aula 13

23

Prova 1

Aula 14

25

Agrupamentos 

Aula 15

30

Agrupamentos: Trabalho em Aula

Aula 16

Maio

2

Agrupamentos 2

Aula 17

7

Trabalho em Aula

(Entrega da Parte 2 do Trabalho Prático)

Aula 18

9

Aula Prática: agrupamentos   

Aula 19

14

 Associação: algoritmo Apriori

Aula 20

16

Trabalho em Aula

Aula 21

21

Associação: outros algoritmos

Aula 22

23

Aula prática sobre Mineração de Regras de Associação

Aula 23

28

Tópicos Especiais

Aula 24

30

Tópicos Especiais

Aula 25

Junho

4

Tópicos Especiais

 

Aula 26

6

Aula Prática 

Aula 27

11

Prova 2

Aula 28

13

 (Entrega da Parte 3 do Trabalho Prático)

Apresentação do Trabalho Prático

Aula 29

18

 FERIADO

Aula 30

20

Apresentação do Trabalho Prático   

Aula 31

25

Apresentação do Trabalho Prático

Aula 32

27

Apresentação do Trabalho Prático

Aula 33

Julho

 

2

Apresentação do Trabalho Prático 

Aula 34

4

Divulgação das notas parciais

Aula 35

9

 REC

Aula 36

11

 Divulgação das notas finais

 

 

 

Bibliografia básica: 

 

Tan,P-N;Steimbach, M; Kumar,V. Introduction to Data Mining. Boston: Addison Wesley, 2006. 769p. 

(os capítulos mais importantes – 2, 4, 6 e 8 - estão disponíveis para download em http://www-users.cs.umn.edu/~kumar/dmbook/index.php#item2 )

 

Bibliografia complementar: 

 

- HAN, J., KAMBER, M. Data Mining: Concepts and Techniques. 2a. ed. New York: Editora Morgan Kaufmann

Publisher, 2006.

- BUSSAB,W.O. , MORETTIN,P.A. Estatística Básica. 5.ed. São Paulo: Editora Saraiva, 2002.

BERRY,M.J.A., LINOFF,G. Data Mining Techniques For Marketing, Sales and Customer Support. 2a ed.

New York: John Wiley & Sons, Inc., 2004.

- CARVALHO,L.A.V. Datamining A Mineração de Dados no Marketing, Medicina, Economia, Engenharia e

Administração. São Paulo: Editora Érica, 2001.

- FERNADEZ,G. Data Mining Using SAS Applications. New York: Editora Chapman & Hall/CRC, 2003.

- MANLY,B.F.J. Multivariate Statistical Methods: A primer. 3a.ed. New York: Chapman & Hall, 2005.