60ª Reunião Anual da SBPC




A. Ciências Exatas e da Terra - 2. Ciência da Computação - 6. Inteligência Artificial e Redes Neurais

DESENVOLVIMENTO DE UMA ARQUITETURA DE REDES NEURAIS ARTIFICIAIS PARA RECONHECIMENTO DE VOZ E CARACTERES MANUSCRITOS

João Paulo Figner de Luna1
Bruno Mayer Sousa e Castro1
Fábio Martins de Oliveira1, 2
Alisson Rabelo Arantes1, 3
Eustáquio São José de Faria1, 3

1. Grupo de Pesquisa em Tecnologias Web/ Instituto de Informática / PUC Minas
2. Prof. Msc. / Orientador
3. Prof. Msc.


INTRODUÇÃO:
A tecnologia da informação se faz cada vez mais presente no dia-a-dia das pessoas e das empresas. Novos recursos tecnológicos são construídos com o objetivo de diminuir o esforço cognitivo das pessoas e aumentar a produtividade nas atividades realizadas pelas mesmas. No entanto, por muitas vezes, não é dada a devida importância com relação à acessibilidade aos recursos tecnológicos disponíveis, dificultando a utilização dos mesmos por parte da população leiga ou aquela que possui algum tipo de deficiência física ou mental. Áreas como a Inteligência Artificial surgem como fonte pesquisa para o desenvolvimento de sistemas computacionais dotados de algum tipo de inteligência e que sejam mais acessíveis aos usuários. Nesse contexto, este trabalho visa contribuir com a acessibilidade dos recursos tecnológicos através do desenvolvimento de uma arquitetura de classes baseada em Redes Neurais Artificiais, uma das técnicas advindas da Inteligência Artificial. Essa arquitetura irá auxiliar os usuários na utilização de sistemas computacionais, agregando aos mesmos a capacidade de reconhecer padrões de voz e caracteres manuscritos, facilitando assim o acesso às novas tecnologias que estão disponíveis nos dias de hoje.

METODOLOGIA:
O projeto teve início com pesquisa bibliografia e revisão da literatura existente, incorporando estudos sobre os conceitos inerentes à Inteligência Artificial, mais especificamente sobre as Redes Neurais Artificiais de Kohonen e Multilayer Perceptron (MLP) para reconhecimento de padrões. Após o levantamento bibliográfico, a próxima etapa consistiu na modelagem e construção de um classificador de voz utilizando as Redes Neurais SOM (Kohonen), e um reconhecedor de caracteres manuscritos a partir de Redes Neurais MLP. A modelagem foi construída utilizando diagramas de classes, para representar a estrutura estática e os relacionamentos entre os componentes da arquitetura, e diagramas de seqüência, para mostrar as interações entre os objetos na realização das atividades propostas. Para esta etapa foi utilizado o software Rational Rose. Para a implementação da arquitetura está sendo utilizada a linguagem Java, por ser gratuita e multiplataforma, e o ambiente de programação NetBeans 5.5.1. Além das Redes Neurais apresentadas anteriormente, três outros modelos foram implementados e estão em fase de testes: Hopfield, Generalized-Brain-State-in-a-Box e Brain-State-in-a-Box. Para mostrar a aplicação da arquitetura desenvolvida, será construído um software interativo de interface Web para auxílio à alfabetização através de jogos educativos.

RESULTADOS:
Com os testes realizados até o momento, pode-se perceber que, ao se utilizar as Redes Neurais SOM para reconhecimento de padrões de voz, a rede se comporta mais como um classificar de padrões do que um reconhecedor propriamente dito. Com as técnicas de treinamento da Rede Neural SOM, padrões considerados semelhantes são agrupados em uma vizinhança comum. Dessa forma, a classificação pode ser usada como padrão de entrada de uma outra Rede Neural para o reconhecimento. Outro aspecto observado foi a dificuldade em transformar um sinal sonoro em um padrão que possa ser processado por uma Rede Neural. Por isso, uma dedicação maior deve ser dada para entendimento das teorias de processamento de sinais. Quanto ao reconhecimento de caracteres manuscritos, a escolha da Rede Neural MLP foi devida à grande utilização da mesma por vários autores da área e a aplicabilidade na resolução deste tipo de tarefa. Assim como na etapa de reconhecimento de voz, um grande tempo está sendo dedicado aos estudos de pré-processamento dos caracteres a ser utilizado no treinamento da Rede Neural.

CONCLUSÕES:
Como foi observado que as Redes Neurais SOM são mais um classificador do que um reconhecedor de padrões, para se obter um melhor resultado deve-se acrescentar os modelos matemáticos denominados LVQs (Learning Vector Quantisation), que utilizam a matriz de classificação da Rede SOM como grupos de padrões de entrada para reconhecimento. Desta forma, considera-se viável a hipótese de utilização das Redes MLP para o reconhecimento de sons. No reconhecimento de caracteres manuscritos foi observado que a natureza não-estruturada desses faz com que seja necessário armazenar diversos exemplos para realizar um reconhecimento eficiente. Porém, antes disso, deve-se realizar o pré-processamento dos caracteres, no qual está sendo utilizada a técnica Undersampled Bitmaps. Diversos autores têm utilizado a arquitetura de rede MLP para reconhecimento de caracteres manuscritos. Fato esse devido ao alcance de resultados mais satisfatórios frente às demais arquiteturas de Redes Neurais e outras técnicas de reconhecimento de caracteres manuscritos. Espera-se ainda poder utilizar outros modelos de Redes Neurais para o reconhecimento de padrões, mostrando assim a aplicabilidade da técnica e podendo comparar diferentes resultados a serem obtidos.

Instituição de fomento: Fundo de Incentivo a Pesquisa – FIP / PUC Minas

Trabalho de Iniciação Científica

Palavras-chave:  Inteligência Artificial, Redes Neurais Artificiais, Reconhecimento de Padrões

E-mail para contato: jpfigner@gmail.com