Visão
Computacional
1. Representação
de
imagens
2. Filtragem
de imagens
3. Detecção
de Bordas
4. Segmentação
Simples
5. Crescimento
de Regiões
6. Segmentação
com
Filtros
7. Segmentação
a Cores
8. Análise
de Texturas
9. Análise
de Texturas
Multiescalar
10. Redes
Neurais
11. Morfologia
Matemática
12. Convolução
13. Esqueletonização
14. Técnicas
Estatísticas
15. Fractais
16. Reconhecimento
de
Formas
17. Representação
de
Objetos
18. Quadtrees
e Octrees
19. Visão
Estereo
20. Inteligência
Artificial
21. Controle
de qualidade
22. Robótica
23. Medicina
24. Sensoriamento
remoto
Material
do
Prof.
Aldo von Wangenheim
Currículo...
Publicações
Pesquisa
Projetos
Ensino
de Graduação
Você
lê?
|
 |
Seminário
Introdução à Visão Computacional
The
Cyclops Project
PPGCC - INE - UFSC
Docentes
Prof. Dr. rer.nat. Aldo
von Wangenheim
Prof. Dr. rer.nat. Eros
Comunello
|
-
Introdução
-
Ementa
da Discilina
-
Temas
a Serem Abordados
-
Funcionamento
da Disciplina
-
Realização
dos Trabalhos Escritos
-
Realização
dos Trabalhos Práticos
-
Conceitos
e Aprovação
-
Bibliografia
-
Banco
de Imagens-Exemplo
-
Banco
de
Imagens para Realização de Trabalhos
-
Apresentação
de Trabalhos:
Introdução
Nesta disciplina iremos
abordar todos os aspectos básicos da Visão Computacional.
Podemos definir Visão Computacional como o
conjunto
de métodos e técnicas através dos quais sistemas computacionais
podem ser capazes de interpretar imagens. A interpretação
de uma imagem pode ser definida em termos computacionais como a
transformação de um conjunto de dados digitais representando
uma imagem (um sinal mono-, bi-, tri- ou tetradimensional) em uma estrutura
de dados descrevendo a semântica deste conjunto de dados em um contexto
qualquer. A Visão Computacional é uma disciplina
que se encontra ainda nos seus primórdios, sendo a grande maioria
de suas soluções e abordagens objeto de pesquisas. Esta pesquisa
envolve toda uma gama de enfoques, desde aplicações bastante
orientadas à solução de problemas práticos
restritos, como o controle de qualidade em linhas de produção
através de inspeção automática até tentativas
de modelagem de processos cognitivos visuais como eles ocorrem nos animais
superiores, numa tentativa de elaborar modelos genéricos de percepção
visual.
Uma das características
mais marcantes do estado da arte em Visão Computacional é
que ainda não existe nenhum modelo genérico de percepção
visual passível de ser aplicado na prática. O nosso conhecimento
de como funcionam os mecanismos de percepção visual nos animais
tampouco é suficiente para que possamos aplicar algum mecanismo
de "engenharia reversa" , utilizando por exemplo técnicas de redes
neurais para modelar ou imitar a percepçaõ visual biológica.
O que ocorre na prática, é que, para resolvermos uma determinada
tarefa de interpretação de imagens utilizamos um conjunto
de algoritmos bastante específicos, que são respectivamente
responsáveis por realizar subtarefas bastante limitadas dentro do
processo de interpretação dessa imagem. Esses algoritmos
são divididos em grupos, como filtros de contraste, detectores de
bordas de objetos, segmentadores de imagens em regiões, classificadores
de texturas e assim por diante. Comumente resolvemos um problema encaixando
um conjunto desses algoritmos um atrás do outro para chegarmos a
um resultado que só funcionará para um conjunto de imagens
com características muito específicas, deixando de funcionar
para todas as outras. Para o leitor mais desavisado essa realidade pode
parecer bastante desanimadora, pois isso realmente esta a mundos de distância
do "computador que vê". Esta limitação nos algoritmos
e nos paradigmas de análise de imagens realmente impõe grandes
limitações ao que pode ser realizado na prática com
as técnicas atualmente disponíveis. Compreender essas limitações
e conhecer formas de tirar o máximo de proveito do que atualmente
há disponível é um aspecto muito importante a ser
considerado por quem deseja enveredar-se por problemas cuja solução
possivelmente envolva o uso de Visão Computacional. A estrutura
da nossa disciplina refletirá este estado da arte.
No correr da disciplina serão
enfocados tanto aspectos teóricos quanto práticos. Nós
vamos ver três principais grupos de temas:
-
Aspectos introdutórios,
percepção visual humana e armazenamento e representação
de imagens.
-
Os principais grupos de algoritmos
de análise de imagens, desde filtros até técnicas
de representação de objetos complexos em imagens.
-
Áreas de aplicação
prática de de Visão Computacional e suas respectivas técnicas,
como controle de qualidade, visão estereo, análise de imagens
na medicina, robótica.
Temas
a Serem Abordados
1. Representação
de imagens
2. Filtragem
de imagens
3. Detecção
de Bordas
4. Segmentação
Simples
5. Crescimento
de Regiões
6. Segmentação
com Filtros
7. Segmentação
a Cores
8. Análise
de Texturas
9. Análise
de Texturas Multiescalar
10. Redes
Neurais
11. Morfologia
Matemática
12. Convolução
13. Esqueletonização
14. Técnicas
Estatísticas
15. Fractais
16. Reconhecimento
de Formas
17. Representação
de Objetos
18. Quadtrees
e Octrees
19. Visão
Estereo
20. Inteligência
Artificial
21. Controle
de qualidade
22. Robótica
23. Medicina
24. Sensoriamento
remoto
Funcionamento
da Disciplina
A disciplina funcionará
basicamente como um seminário prático. O conteúdo
é dividido em temas (acima relacionados) a serem trabalhados um
por cada participante da disciplina. Haverá:
-
Uma introdução
pelo Professor de cada tema no início da disciplina, criando uma
visão geral de toda a Visão Computacional antes do início
das apresentações.
-
Um tema que deverá ser
desenvolvido como um trabalho escrito e será apresentado pelo aluno.
-
Um trabalho experimental envolvendo
o tema do seminário, sempre visando resolver um problema prático.
Este também será apresentado ao final do trabalho teórico.
A parte prática da disciplina
será realizada através da utilização do laboratório
de análise de imagens Khoros. Khoros, hoje um produto comercial,
foi desenvolvido originalmente pela University of New Mexico em colaboração
com a UNICAMP e é o mais utilizado sistema para teste e experimentação
de soluções de Visão Computacional. Ele provê
um conjunto bastante extenso de implementações de algoritmos
de Visão Computacional e um ambiente de programação
visual onde conjuntos complexos de algoritmos podem rapidamente ser implementados
como uma solução e testados. A disciplina incluirá,
no seu início, aulas de laboratório para a aprendizagem da
utilização do Khoros. Khoros é uma ferramenta para
ambiente Unix e encontra-se instalado em todas as estações
Sun e todos os PCs Linux do INE, além dos PCs Linux do Laboratório
3 do CTC. Um tutorial do Khoros estará também à disposição
na rede.
Realização
dos Trabalhos Escritos
Para cada tema será distribuído
material bibliográfico. Serão sempre mais de um documento
e estes serão capítulos de livros ou artigos. Com base neste
material será desenvolvido um trabalho escrito que não será
meramente uma tradução dos artigos e que será apresentado
em data a ser marcada no último mês do trimestre. Será
dado grande valor à elaboração detalhada dos
aspectos matemáticos do tema.
Instruções
para este trabalho:
-
O trabalho será escrito
em no padrão formatção de textos LaTeX.
A seguir será convertido em site através da utilização
do conversor la2html e de um editor HTML qualquer. Ao final
o aluno deverá ter desenvolvido um site sobre o tema que
abordou no seminário e uma monografia .tex,. Os resultados dos experimentos
práticos realizados pelo aluno deverão ter sido incluídos
no site e na monografia.
-
O trabalho será apresentado
através de slides desenvolvidos em Microsoft PowerPoint ou
StarOffice
com base em um template
disponível nesta página.
-
Este site será incluído
na página desta disciplina (em http://www.inf.ufsc.br/~visao/2001/<nome
do tema>) uma semana antes da apresentação do seminário,
para que esteja acessável na data da apresentação.
-
O formato do trabalho deverá
obrigatoriamente
ser o formato padrão das páginas do site da disciplina com
base neste template.
Toque:
Para usar este site como template carregue-o no editor de páginas
do Netscape (modo "Edit Page") e salve-o localmente em seu computador.
Assim você terá uma cópia local desta página,
inclusive todas as figuras de fundo, e poderá utilizá-la
para desenvolver seu trabalho.
-
Importante: O site desenvolvido,
além de possuir o formato padrão da disciplina, deverá
obrigatoriamente ser desenvolvido em HTML padrão. Evite utilizar
editores HTML que podem produzir páginas fora de padrão,
como Microsoft FrontPage. Tampouco será permitido gerar página
HTML com texto em GIFs a partir da apresentação Microsoft
PowerPoint. Sugerimos que se utilize o editor do Netscape ou um editor
HTML para Linux disponível na Internet.
-
Tanto
o site HTML quanto a monografia (em .tex) e os slides PPT deverão
ser entregues ao professor no mínimo uma semana antes da
data prevista para a apresentação para autorização
para ser apresentado. O seminário não será apresentado
sem autorização prévia do profesor, não recebendo
nota. Atrasos na apresentação prévia levarão
a descontos no conceito final.
Realização
dos Trabalhos Práticos
Para cada tema de seminário
será distribuída uma tarefa prática envolvendo o tema.
Esta tarefa consistira em um problema prático que deverá
ser resolvido com as técnicas abordadas no tema do seminário.
Para a solução dos problema serão utilizados os recursos
disponíveis no Khoros.
A definição
do problema, o caminho para a solução e os resultados obtidos
serão apresentados ao fim do apresnetação do tema
no seminário.
Uma ajuda voce pode ter atraves
do Curso de Analise de
Imagens usando Khoros que esta aqui. O software você pode
pegar aqui.
Observe o seguinte: Este arquivo para download possui 25 MB, espere portanto
o momento adequado para buscá-lo se você vai fazê-lo
de casa por conexão telefônica. Observe também que
neste tarfile está a versão compilada para Linux e também
os fontes, que você poderá compilar para Solaris, AIX, Irix
ou HP-UX, caso deseje. Se você vai usar a versão précompilada
Linux, rode o programa
kconfigure antes de iniciar a primeira execução.
Se você vai compilar em outro sistema operacional, leia atentamente
toda a documentação antes de fazê-lo.
Conceitos
e Aprovação
Estará aprovado somente
aquele aluno inscrito que:
-
Desenvolver trabalho escrito
acerca de seu tema no formato
prescrito.
-
Apresentar uma versão
draft do trabalho ao professor para revisão
antes da apresentação no seminário até a data
definida pelo professor.
-
Apresentar este trabalho sob
forma de seminário de maneira satisfatória.
-
Desenvolver de forma satisfatória
o trabalho prático, apresentando seus resultados.
-
Entregar cópia dos documentos
supracitados e instalar o site desenvolvido na página da disciplina.
O conceito final do aluno dependerá:
a) da qualidade do trabalho escrito, b) da qualidade do trabalho prático
e c) da qualidade da apresentação. A participação
no seminário implica no aceite das condições acima
estabelecidas.
Bibliografia
-
David Marr: Vision
- A Computational Investigation into the Human Representation and Processing
of Visual Information, W.H.Freeman & Co.,1982
-
R. Gonzalez, R.Woods: Digital
Image Processing, Addison Wesley, 1993
-
John C. Russ: The
Image Processing Handbook, CRC Press, 1995
-
B.D.Ripley: Pattern
Recognition and Neural Networks, Cambridge Univ. Press, 1996
-
R.D.Boyle, R.C.Thomas: Computer
Vision - A First Course, Blackwell Scientific, 1988
-
Perker: Algorithms
for Image Processing and Computer Vision
-
Torras: Computer Vision:
Theory and Industrial Application
-
Haralick, Shapiro: Computer
and Robot Vision, Volumes I & II,
-
Buxton: Computer Vision
- EECV 96: fourth European Conf.of Computer Vision
-
Mundy: Geometry Invariance
in Computer Vision
-
Brown: Real-time Computer
Vision
-
Young: Handbook of
Pattern Recoginition and Image Processing, Academic Press
-
Metaxas: Physics-Based
Deformable Models
-
Hanan Samet: The Design
and Analysis of Spatil Data Structures, Addison Wesley, 1989
Material Extra:
-
Artigo de Mumford e Shah (segmentação)
-
Tese de Peter Klausmann (segmentação)
-
Tese de Gangolf Mittelhaeusser
(segmentação)
-
Tese de Joachim Weickert (filtros
de difusão anisotrópica)
Obs.: Todos estes livros
se encontram disponíveis ou no Centro de Documentação
do INE ou na coleção particular do Professor.
Contato:
Tel.: +55-48-331
7552/9498
FAX: +55-48-331-9770
awangenh@inf.ufsc.br
O
que estou lendo ? "In
the Beginning was the Command Line" por Neal Stephenson. Veja aqui o que
é...
|
|