
A classificação supervisionada e a não supervisionada são duas grandes metas de machine learning. Ambas permitem classificar, ou seja, atribuir indivíduos a grupos. Mas, o que as distingue?
- Os métodos de classificação supervisionada requerem que o conhecimento prévio da composição dos grupos. A variável qualitativa, que identifica o grupo a que cada indivíduo pertence, assume o papel de variável dependente. O objetivo é, a partir das características dos indivíduos de que se dispõe (variáveis independentes), desenvolver modelos que consigam predizer a que grupo cada indivíduo pertence. Estes modelos são utilizados para fins preditivos, ou seja, conhecendo as características de novos indivíduos, os modelos permitem predizer a que grupo pertencem, sujeito a erros de classificação. Estes métodos permitem quantificar a probabilidade de pertencer a um determinado grupo, ou seja, permitem quantificar riscos.
- Na classificação não supervisionada, não se dispõe de uma variável que identifique grupos, procurando-se encontrar uma estrutura nos dados que permita agrupá-los. Todas as variáveis têm o mesmo papel na análise. Estes métodos são muito úteis para tipificar indivíduos e identificar outliers multivariados (indivíduos com padrões atípicos).
Exemplos de aplicação
Área |
Classificação supervisionada | Classificação não supervisionada |
Marketing | Avaliar a propensão à compra de um produto tendo em conta as características do cliente | Segmentar clientes a partir do seu histórico de consumo
|
Turismo | Quantificar o risco de cancelamento de uma reserva | Traçar perfis de reservas (de lazer ou de negócios, por exemplo) |
Medicina | Estimar a probabilidade de contrair uma doença, tendo em conta o seu nível de exposição a determinados fatores de risco | Segmentar pacientes tendo em conta o seu estilo de vida (exercício físico, alimentação, etc) |
Genética | Avaliar o risco de cancro através da expressão genética dos pacientes | Analisar dados de expressão genética através da identificação de genes com expressão similar |
Finanças | Predizer se o valor de uma ação vai aumentar;
Quantificar o risco de crédito; |
Segmentar clientes tendo em conta o seu histórico de utilização do cartão de crédito |
Psicologia | Predizer se os indivíduos são favoráveis a determinada política de direitos humanos, tendo em conta as suas atitudes | Tipificar indivíduos a partir dos seus valores, atitudes e comportamentos |