CONTRIBUIÇÕES DA ESTATÍSTICA PARA A EDUCAÇÃO NO BRASIL

 

Ruben Klein (Fundação Cesgranrio)

Dalton Francisco Andrade (UFSC)

Wilton de Oliveira Bussab (FGV/SP)

 

 

Panorama da educação brasileira

Ruben Klein

Dalton Francisco Andrade

Wilton de Oliveira Bussab

 

Resumo.

 

Nesta apresentação, procuraremos dar um quadro da educação brasileira com o panorama da movimentação e fluxo escolar concomitante com os resultados das avaliações de aprendizagem. Mostraremos a necessidade de uma coleta de dados correta, do bom uso do pensamento estatístico e das técnicas estatísticas.

 

As interpretações corretas contribuem decisivamente para o entendimento do sistema escolar e apresentam diagnósticos que podem e devem ser utilizadas pelos professores, escolas, secretarias e sociedade para a melhoria da qualidade de ensino.

 

Os diagnósticos existem. Precisam ser utilizados. É importante perceber que não há necessidade de fazer avaliações anuais de aprendizagem em todos os alunos para descobri-los.

 

No Brasil, os dados educacionais mais antigos são referentes à movimentação e fluxo escolar e provêm dos Censos Demográficos, dos Censos Escolares (desde 1932), e das PNADs (desde meados da década de 70). Somente na década de 90, através de avaliações externas de aprendizagem, em especial do SAEB de caráter nacional, o Brasil começa a ter informações sobre o que os alunos sabem e são capazes de fazer quando terminam o Ensino Fundamental e o Ensino Médio. É com o SAEB também que começam, no Brasil, os estudos de fatores associados à aprendizagem baseados nos dados.

 

Os Censos escolares coletam anualmente dados sobre o número de matrículas, inclusive por idade e em alguns anos por sexo, de alunos repetentes no início do ano e de alunos aprovados, reprovados e afastados por abandono do ano anterior, enquanto os Censos Demográficos e as PNADs coletam dados sobre freqüência a escola em setembro, série concluída e idade, além de variáveis sócio-econômicas.

 

Para utilizar estes dados e verificar se foram bem coletados são necessários modelos e estudos de adequação desses modelos e dos dados.

 

Infelizmente a interpretação destes dados até a década de 90 era feita de maneira incorreta e gerou muitos mitos errados que deram origem a muitas políticas erradas.

 

Citamos alguns mitos da década de 80:

50% das crianças não chegam a 2ª série;

As crianças não estão nas escolas;

Problema é evasão;

25% dos alunos na 1ª série se evadem;

25% de repetência na 1ª série;

Somente 20% das crianças chegam a 8ª série.

 

Pretendemos mostrar a origem desses mitos baseados nos erros de interpretação dos dados,  no uso inadequado da pirâmide educacional e nos conceitos errados de repetente e da taxa de aprovação. Pretendemos mostrar o modelo de fluxo correto.

 

Como conseqüência dos mitos, que ressaltavam a evasão e que as crianças não estavam na escola, a política educacional no Brasil era construir escola (muitos políticos brasileiros ainda acreditam nisto) e as famílias eram culpadas por não manterem os filhos na escola.

 

A partir do final da década de 80, mostrou-se que  o grande problema era a repetência e não a evasão anual. Os alunos não concluíam a 8ª série por ficarem repetindo as séries anteriores, até serem “expulsos” da escola, mas ficavam em média, mais de 8 anos na escola. Este diagnóstico muda o enfoque da família para a escola. As famílias estão mantendo os filhos na escola que não está cumprindo seu papel adequadamente.

 

De fato, na década de 80, as matrículas aumentaram muito e junto houve um aumento da repetência. Somente na década de 90, com a conscientização do problema da repetência é que as taxas de repetência começam a cair, enquanto as matrículas continuaram a crescer.

 

Para ilustrar, fornecemos os dados corretos sobre os mitos, em 1981:

85% de uma coorte tinham acesso à 2ª série;

83% das crianças de 7 a 14 anos estão na escola (incluindo pré-escola e ensino médio), 82% estão no ensino fundamental;

Somente cerca de 2% dos alunos se evadiam na 1ª série;

Cerca de 58% repetiam a 1ª série;

Cerca de 37% de uma coorte chegavam a 8ª série.

 

Houve uma grande evolução e em 2001:

96% de uma coorte tinham acesso à 2ª série,

96% das crianças de 7 a 14 anos estão na escola (incluindo pré-escola e ensino médio), 93% estão no ensino fundamental;

Somente cerca de 1% dos alunos se evadiam na 1ª série;

Cerca de 32% dos alunos repetem a 1ª série;

Cerca de 62% de uma coorte chegam a 8ª série.

 

É claro que ainda há muito que melhorar em termos das taxas de repetência e de conclusão do ensino fundamental.

 

A qualidade de ensino está sendo avaliada pelo SAEB (Sistema Nacional de Avaliação da Educação Básica) realizado a cada dois anos desde 1995. O SAEB aplica testes em uma amostra probabilística de alunos das 4ª e 8ª séries do ensino fundamental e da 3ª série do ensino médio, representativa por UF e dependência administrativa. Desde 1995, testa Compreensão de Leitura e Matemática. Em 1997 e 1999 testou também Ciências e em 1999 História e Geografia. O SAEB também tem questionários para obter informações sobre características socioeconômicas e culturais e hábitos de estudo dos alunos, questionários para professores e diretores e sobre as condições das escolas. Estas variáveis são utilizadas em análises para caracterizar o alunado e para procurar variáveis associadas ao bom desempenho e que possam ser alvo de ação da escola e de políticas públicas.

 

O uso de uma amostra de 3% de um total de cerca de 9 milhões de estudantes, capaz de traçar um perfil adequado do Ensino Básico, segundo alguns segmentos de interesse, tais como unidades da federação, rede de ensino e séries, exige um planejamento cuidadoso e fortemente apoiado pela metodologia estatística de amostragem. Ilustraremos esses cuidados estatísticos para a coleta dos dados com os procedimentos empregados no desenho da amostra do SAEB.

 

O Saeb utiliza a Teoria de Resposta ao Item (TRI) e os Modelos Lineares Hierárquicos ou Multi-níveis nas análises de seus resultados. A TRI é utilizada para a estimação das proficiências dos alunos na disciplina para a qual ele foi selecionado. Esta teoria propõe  modelos matemáticos para representar a relação entre a probabilidade de um aluno responder corretamente a um item (questão no teste) e seus traços latentes ou habilidades na área do conhecimento avaliada, os quais não são observados diretamente. Os modelos dependem do tipo de item e dos grupos de alunos que estão sendo avaliados. A inclusão de itens comuns entre anos e entre séries na construção dos testes permite resultados comparáveis entre séries e ao longo dos anos. Por exemplo, com a inclusão de itens de 4a. série nos testes da 8a. série e de itens de 8a. série nos testes da 3a. série do ensino médio o SAEB permite que as proficiências de todos os alunos, independentemente de série, sejam estimadas na mesma escala de medida. Como o SAEB também utiliza itens comuns nos testes de diferentes anos, no final do processo de estimação tem-se que os desempenhos das diferentes séries nos diferentes anos estejam todos medidos na mesma escala.

 

Para melhor avaliar uma disciplina/série, o SAEB utiliza um grande número de itens. O tempo necessário para um aluno responder a todos estes itens é grande e não é apropriado para este tipo de avaliação. Por isso, os itens de cada disciplina/série são distribuídos através de um planejamento em blocos incompletos balanceados (BIB) em diferentes cadernos de teste e o aluno só responde a um caderno.

 

Para fazer sentido dos resultados, o SAEB interpreta a escala em alguns níveis com uma descrição do que os alunos sabem e são capazes de fazer quando estão naqueles níveis.

 

Os Modelos Lineares Hierárquicos ou Multi-níveis são utilizados  nas chamadas análises dos fatores associados ou seja, nas análises para caracterizar o alunado e para estudar como os fatores de aluno e escola estão associados com o desempenho desses alunos. Esses modelos são modelos de regressão nos quais a variável dependente (resposta) é a proficiência, obtida com a TRI, e as variáveis independentes são obtidas a partir das características de aluno, professor  e escola obtidas a partir dos questionários aplicados pelo SAEB e de outras pesquisas, como o Censo Escolar. Eles se diferenciam dos modelos de regressão usuais ao incorporarem em suas formulações correlações entre proficiências de alunos de uma mesma escola. Espera-se que alunos de uma mesma escola sejam mais parecidos entre si, em termos de proficiência, do que alunos de escolas diferentes. Ao incorporar a hierarquia natural que existe nos dados, alunos dentro de escolas, esta metodologia de análise permite também que se quantifique o quanto da variabilidade total apresentada pelas proficiências dos alunos pode ser atribuída aos alunos e às escolas.

 

O SAEB e os resultados de fluxo escolar mostram que o Brasil tem um grande problema de qualidade de ensino, e que o desempenho é mais baixo nas regiões onde as taxas de repetência são mais altas


Anais da 56ª Reunião Anual da SBPC - Cuiabá, MT - Julho/2004