CCO - 740 Reconhecimento de Padrões (Pattern Recognition)

Quantidade de créditos (amount of credits): 8
Total de horas de aulas teóricas (Total hours of theoretical classes): 60
Total de horas de aulas de exercícios, seminários ou estudos dirigidos (Total hours of exercise classes, seminars or directed studies): 60

Objetivo (Objective):

Fornecer aos estudantes as ferramentas matemáticas para o desenvolvimento de sistemas computacionais de reconhecimento de padrões e aprendizado de máquina. Ao final da disciplina, o aluno deverá estar apto a:
1) projetar e implementar classificadores supervisionados lineares ou não lineares oriundos de um amplo conjunto de paradigmas (Teoria de Decisão Bayesiana, Métodos baseados em neurônios artificiais, Máquinas de vetores de suporte, Regressão logística, dentre outras abordagens não paramétricas);
2) projetar e implementar classificadores não supervisionados para encontrar agrupamentos em dados multivariados (k-médias, modelos de mistura de Gaussianas e o algoritmo Expectation-Maximization);
3) projetar e implementar métodos de extração de atributos para redução de dimensionalidade (Análise de componentes principais, Análise discriminante linear, Kernel PCA);
4) avaliar o desempenho de métodos de classificação supervisionada a partir de métricas quantitativas.
(To provide the students with the mathematical tools for the development of pattern recognition and machine learning systems. At the end of the course, the student should be able to:
1) design and code linear or non-linear supervised classifiers from a broad set of paradigms (Bayes decision theory, Methods based on artificial neurons, Support Vector Machines, Logistic regression, among other non-parametric approaches);
2) design and code unsupervised classifiers to find clusters in multivariate data (hierarquical clustering, k-means, Gaussian mixture models and the Expectation-Maximization algorithm);
3) design and code feature extraction methods for dimensionality reduction (Principal Component Analysis, Linear Discriminant Analysis, Kernel PCA);
4) assess the supervised classification performance using quantitative metrics (confusion matrix, accuracy, Kappa coefficient))


Ementa (Catalog Description):

- Classificação supervisionada: Perceptron, Adaline (Widrow-Hoff), Regressão logística, Teoria de Decisão Bayesiana, Classificação Bayesiana sob hipótese Gaussiana, Classificador de mínima distância, k vizinhos mais próximos, Máquinas de vetores de suporte.
(Supervised classification: Perceptron, Adaline (Widrow-Hoff), Logistic regression, Bayes Decision Theory, Bayesian classifier under Gaussian hypothesis, minimum distance classifier, K-nearest neighbors, support vector machines.)

- Classificação não supervisionada: Agrupamento hierárquico, o método k-médias, modelos de mistura de Gaussianas e o algoritmo Expectation-Maximization.
(Unsupervised classification: Hierarquical clustering, the k-means algorithm, Gaussian mixture models and the Expectation-Maximization algorithm.)

- Extração de atributos
(Feature extraction)

- Métodos lineares de redução de dimensionalidade: Análise de componentes principais (PCA), Análise discriminante linear (LDA), Fatorização não negativa de matrizes (NMF).
(Linear methods for dimensionality reduction: Principal component analysis (PCA), Linear discriminant analysis (LDA), Non-negative matrix factorization (NMF))

- Métodos não lineares baseados em kernel: Kernel PCA
(Non-linear Kernel based methods: Kernel PCA)

- Métricas de avaliação de desempenho: matriz de confusão, acurácia, precision e recall, F1-score e o coeficiente Kappa de Cohen. Métodos de estimação do erro/acurácia: holdout, resubstitution, k-fold cross validation e leave-one-out cross validation.
(Performance evaluation metrics: confusion matrix, accuracy, precision and recall, F1-score, Cohen's Kappa coefficient. Error/Accuracy estimation methods: holdout, resubstitution, k-fold cross validation and leave-one-out cross validation.)

- Tópicos avançados e atualidades: aprendizado de variedades, redes neurais, backpropagation, aprendizado profundo, metric learning, etc.
(Advanced topics and new trends: Manifold learning, neural networks, backpropagation, deep learning, metric learning, etc.)


Bibliografia (Bibliography):

Richard O. Duda, Peter E. Hart, David G. Stork, Pattern Classification, 2nd Edition, Wiley-Interscience, 2000 (disponível na BCO).

Andrew R. Webb, Keith D. Copsey, Statistical Pattern Recognition, 3rd Edition, Wiley, 2011 (disponível na BCO).

Sergios Theodoridis, Konstantinos Koutroumbas, Pattern Recognition, 4th Edition, Academic Press, 2008 (disponível na BCO).

Keinosuke Fukunaga, Introduction to Statistical Pattern Recognition, 2nd Edition, Academic Press, 2013 (disponível na BCO).

 

Geoff Dougherty, Pattern Recognition and Classification: An Introduction, Springer, 2013.

Trevor Hastie, Robert Tibshirani, Jerome Friedman, The Elements of Statistical Learning: Data Mining, Inference, and Prediction, 2nd Edition, Springer, 2016.

Kevin P. Murphy, Machine Learning: A Probabilistic Perspective, MIT Press, 2012.

Christopher M. Bishop, Pattern Recognition and Machine Learning, Springer, 2011.

Jürgen Schürmann, Pattern Classification: A Unified View of Statistical and Neural Approaches, 1st Edition, Wiley-Interscience, 1996.