60ª Reunião Anual da SBPC

INTRODUÇÃO:

A tecnologia da informaÃ§Ã£o se faz cada vez mais presente no dia-a-dia das pessoas e das empresas. Novos recursos tecnolÃ³gicos sÃ£o construÃdos com o objetivo de diminuir o esforÃ§o cognitivo das pessoas e aumentar a produtividade nas atividades realizadas pelas mesmas. No entanto, por muitas vezes, nÃ£o Ã© dada a devida importÃ¢ncia com relaÃ§Ã£o Ã acessibilidade aos recursos tecnolÃ³gicos disponÃveis, dificultando a utilizaÃ§Ã£o dos mesmos por parte da populaÃ§Ã£o leiga ou aquela que possui algum tipo de deficiÃªncia fÃsica ou mental. Ãreas como a InteligÃªncia Artificial surgem como fonte pesquisa para o desenvolvimento de sistemas computacionais dotados de algum tipo de inteligÃªncia e que sejam mais acessÃveis aos usuÃ¡rios. Nesse contexto, este trabalho visa contribuir com a acessibilidade dos recursos tecnolÃ³gicos atravÃ©s do desenvolvimento de uma arquitetura de classes baseada em Redes Neurais Artificiais, uma das tÃ©cnicas advindas da InteligÃªncia Artificial. Essa arquitetura irÃ¡ auxiliar os usuÃ¡rios na utilizaÃ§Ã£o de sistemas computacionais, agregando aos mesmos a capacidade de reconhecer padrÃµes de voz e caracteres manuscritos, facilitando assim o acesso Ã s novas tecnologias que estÃ£o disponÃveis nos dias de hoje.

METODOLOGIA:

O projeto teve inÃcio com pesquisa bibliografia e revisÃ£o da literatura existente, incorporando estudos sobre os conceitos inerentes Ã InteligÃªncia Artificial, mais especificamente sobre as Redes Neurais Artificiais de Kohonen e Multilayer Perceptron (MLP) para reconhecimento de padrÃµes. ApÃ³s o levantamento bibliogrÃ¡fico, a prÃ³xima etapa consistiu na modelagem e construÃ§Ã£o de um classificador de voz utilizando as Redes Neurais SOM (Kohonen), e um reconhecedor de caracteres manuscritos a partir de Redes Neurais MLP. A modelagem foi construÃda utilizando diagramas de classes, para representar a estrutura estÃ¡tica e os relacionamentos entre os componentes da arquitetura, e diagramas de seqÃ¼Ãªncia, para mostrar as interaÃ§Ãµes entre os objetos na realizaÃ§Ã£o das atividades propostas. Para esta etapa foi utilizado o software Rational Rose. Para a implementaÃ§Ã£o da arquitetura estÃ¡ sendo utilizada a linguagem Java, por ser gratuita e multiplataforma, e o ambiente de programaÃ§Ã£o NetBeans 5.5.1. AlÃ©m das Redes Neurais apresentadas anteriormente, trÃªs outros modelos foram implementados e estÃ£o em fase de testes: Hopfield, Generalized-Brain-State-in-a-Box e Brain-State-in-a-Box. Para mostrar a aplicaÃ§Ã£o da arquitetura desenvolvida, serÃ¡ construÃdo um software interativo de interface Web para auxÃlio Ã alfabetizaÃ§Ã£o atravÃ©s de jogos educativos.

RESULTADOS:

Com os testes realizados atÃ© o momento, pode-se perceber que, ao se utilizar as Redes Neurais SOM para reconhecimento de padrÃµes de voz, a rede se comporta mais como um classificar de padrÃµes do que um reconhecedor propriamente dito. Com as tÃ©cnicas de treinamento da Rede Neural SOM, padrÃµes considerados semelhantes sÃ£o agrupados em uma vizinhanÃ§a comum. Dessa forma, a classificaÃ§Ã£o pode ser usada como padrÃ£o de entrada de uma outra Rede Neural para o reconhecimento. Outro aspecto observado foi a dificuldade em transformar um sinal sonoro em um padrÃ£o que possa ser processado por uma Rede Neural. Por isso, uma dedicaÃ§Ã£o maior deve ser dada para entendimento das teorias de processamento de sinais. Quanto ao reconhecimento de caracteres manuscritos, a escolha da Rede Neural MLP foi devida Ã grande utilizaÃ§Ã£o da mesma por vÃ¡rios autores da Ã¡rea e a aplicabilidade na resoluÃ§Ã£o deste tipo de tarefa. Assim como na etapa de reconhecimento de voz, um grande tempo estÃ¡ sendo dedicado aos estudos de prÃ©-processamento dos caracteres a ser utilizado no treinamento da Rede Neural.

CONCLUSÕES:

Como foi observado que as Redes Neurais SOM sÃ£o mais um classificador do que um reconhecedor de padrÃµes, para se obter um melhor resultado deve-se acrescentar os modelos matemÃ¡ticos denominados LVQs (Learning Vector Quantisation), que utilizam a matriz de classificaÃ§Ã£o da Rede SOM como grupos de padrÃµes de entrada para reconhecimento. Desta forma, considera-se viÃ¡vel a hipÃ³tese de utilizaÃ§Ã£o das Redes MLP para o reconhecimento de sons. No reconhecimento de caracteres manuscritos foi observado que a natureza nÃ£o-estruturada desses faz com que seja necessÃ¡rio armazenar diversos exemplos para realizar um reconhecimento eficiente. PorÃ©m, antes disso, deve-se realizar o prÃ©-processamento dos caracteres, no qual estÃ¡ sendo utilizada a tÃ©cnica Undersampled Bitmaps. Diversos autores tÃªm utilizado a arquitetura de rede MLP para reconhecimento de caracteres manuscritos. Fato esse devido ao alcance de resultados mais satisfatÃ³rios frente Ã s demais arquiteturas de Redes Neurais e outras tÃ©cnicas de reconhecimento de caracteres manuscritos. Espera-se ainda poder utilizar outros modelos de Redes Neurais para o reconhecimento de padrÃµes, mostrando assim a aplicabilidade da tÃ©cnica e podendo comparar diferentes resultados a serem obtidos.

Instituição de fomento: Fundo de Incentivo a Pesquisa â€“ FIP / PUC Minas

Trabalho de Iniciação Científica

Palavras-chave: InteligÃªncia Artificial, Redes Neurais Artificiais, Reconhecimento de PadrÃµes

E-mail para contato: jpfigner@gmail.com