60ª Reunião Anual da SBPC

INTRODUÇÃO:

Biometria, no contexto deste trabalho, refere-se à autenticação ou identificação de indivíduos pela aplicação de métodos estatísticos na análise de suas características físicas (e.g., impressão digital), comportamentais (e.g., assinatura), ou até mesmo químicas (e.g, odores). Como muitas destas características são únicas para cada indivíduo, a biometria pode prover um sistema de autenticação mais confiável, e certamente mais conveniente, que cartões, chaves, senhas, ou outros sistemas tradicionais. O uso de sinais biométricos fornece um campo de aplicação privilegiado ao reconhecimento de padrões e ao processamento de sinais. Fundamentado em experiências prévias, onde resultados obtidos até o momento apontam para o agrupamento de dados como sendo um ponto sensível no tratamento e extração de parâmetros de sinais biométricos, o presente projeto foca o estudo de algoritmos de agrupamento de dados na extração de características de sinais biométricos. O estudo da influência dos algoritmos de agrupamento em sistemas biométricos é de interesse prático, porque o uso de biometria é uma tendência forte; e teórico, pois o agrupamento de dados, apesar de ser um tópico clássico, ainda apresenta questões abertas que influenciam sua aplicação em diversas áreas do conhecimento.

METODOLOGIA:

Inicialmente, foi feita uma ampla revisão bibliográfica e um mapeamento das principais estratégias de pré-processamento de sinais baseadas em agrupamento de dados, aplicadas a sistemas biométricas, com ênfase naquelas baseadas em sinais dinâmicos. Em seguida, os algoritmos retidos nesta etapa foram implementados e estudados mais a fundo. Esta fase, por ser mais abrangente, ocupou a primeira metade do projeto. Com base nos estudos realizados na primeira etapa, decidimos que a melhor abordagem para tratar os agrupamentos de dados na biometria seria através de uma ferramenta genérica, que pudesse ser aplicada em qualquer biometria e em combinação com qualquer técnica de agrupamento. O framework desenvolvido encontra-se descrito na próxima seção, no desenvolvimento do mesmo, a ferramenta gratuita Scilab foi utilizada para realização de testes e simulações. Um seminário com o título “Introdução ao Agrupamento de Dados” foi apresentado pelo bolsista deste projeto com o intuito fundamental de despertar o interesse dos estudantes para esta área. Também foi ministrado um mini-curso intitulado “Biometria” na VII Escola Regional de Computação Bahia – Alagoas – Sergipe. Reuniões individuais com o orientador foram realizadas semanalmente, com duração de 2 horas cada.

RESULTADOS:

Foi desenvolvida uma ferramenta genérica, a partir da revisão bibliográfica e fundamentada na teoria da informação, para o uso de algoritmos de agrupamento. Nosso método consiste em, assumir que os vetores de características são amostras de uma variável aleatória multi-variada (VA). Daí, busca-se uma transformação não-linear do espaço que maximiza a entropia associada a esta VA, ou seja, uma equalização de histograma. Em seguida, a transformação inversa (que implica uma redução da entropia) é aplicada para enfatizar a separação entre os padrões, concentrado-os em grupos mais compactos que os originais. Para o primeiro passo (equalização), utilizamos a seguinte analogia: imaginemos que nossos dados sejam um conjunto de cargas elétricas de mesmo sinal e módulo. A equalização de histograma está intimamente ligada ao aumento da entropia, que está relacionado a uma diminuição da energia potencial, o que ocorre com as forças conservativas, como a de repulsão eletrostática. Para o segundo passo, aplicamos o mapeamento inverso daquele que leva as cargas da distribuição original para a distribuição de maior entropia. Testes com algoritmos clássicos de agrupamento mostraram que a técnica proposta melhora o desempenho, mas esta melhora depende fortemente da distribuição dos dados originais.

CONCLUSÕES:

Ao invés criarmos uma nova utilidade para o agrupamento de dados na biometria, ou mesmo criar um novo algoritmo, decidimos abordar o problema da forma mais geral possível. Fomos capazes de desenvolver, baseados em conceitos da teoria da informação, uma ferramenta para seleção de característica e aumento de desempenho dos algoritmos de agrupamento aplicados aos dados biométricos. A vantagem do framework desenvolvido é sua generalidade, podendo ser usado em qualquer dado numérico. Temos um conjunto de ferramentas com ampla gama de aplicação: um maximizador de entropia para distribuições n-dimensionais; um equalizador de histograma n-dimensional que não requerer o conhecimento da expressão analítica da pdf do conjunto de dados; uma família de medidas de dissimilaridade, únicas para cada conjunto de dados; e uma transformação do espaço que facilita o trabalho dos algoritmos de agrupamento. Os dois primeiros são de utilidade em comunicação e processamento de imagem, por exemplo. A família de medidas de distância merece ser investigada, pois pode ser uma alternativa às métricas escolhidas arbitrariamente nos problemas de agrupamento/classificação de dados. A última ferramenta pode ser usada em conjunto com qualquer algoritmo de agrupamento existente para melhorar seu desempenho.

Instituição de fomento: CAPES/CNPq;

Trabalho de Iniciação Científica

Palavras-chave: Agrupamento de Dados, Biometria, Reconhecimento de Padrões

E-mail para contato: janio.canuto@gmail.com