CONTRIBUIÇÕES DA
ESTATÍSTICA PARA A EDUCAÇÃO NO BRASIL
Ruben Klein (Fundação Cesgranrio)
Dalton Francisco Andrade (UFSC)
Wilton de Oliveira Bussab
(FGV/SP)
Panorama da educação
brasileira
Ruben Klein
Dalton Francisco Andrade
Wilton de Oliveira Bussab
Resumo.
Nesta apresentação, procuraremos dar um quadro da educação
brasileira com o panorama da movimentação e fluxo escolar concomitante com
os resultados das avaliações de aprendizagem. Mostraremos a necessidade de uma
coleta de dados correta, do bom uso do pensamento estatístico e das técnicas
estatísticas.
As interpretações corretas contribuem decisivamente para o
entendimento do sistema escolar e apresentam diagnósticos que podem e devem ser
utilizadas pelos professores, escolas, secretarias e sociedade para a melhoria
da qualidade de ensino.
Os diagnósticos existem. Precisam ser utilizados. É
importante perceber que não há necessidade de fazer avaliações anuais de
aprendizagem em todos os alunos para descobri-los.
No Brasil, os dados educacionais mais antigos são referentes
à movimentação e fluxo escolar e provêm dos Censos Demográficos, dos Censos
Escolares (desde 1932), e das PNADs (desde meados da
década de 70). Somente na década de 90, através de avaliações externas de
aprendizagem, em especial do SAEB de caráter nacional, o Brasil começa a ter
informações sobre o que os alunos sabem e são capazes de fazer quando terminam
o Ensino Fundamental e o Ensino Médio. É com o SAEB também que começam, no
Brasil, os estudos de fatores associados à aprendizagem baseados nos dados.
Os Censos escolares coletam anualmente dados sobre o número
de matrículas, inclusive por idade e em alguns anos por sexo, de alunos
repetentes no início do ano e de alunos aprovados, reprovados e afastados por
abandono do ano anterior, enquanto os Censos Demográficos e as PNADs coletam dados sobre freqüência a escola em setembro,
série concluída e idade, além de variáveis sócio-econômicas.
Para utilizar estes dados e verificar se foram bem coletados
são necessários modelos e estudos de adequação desses modelos e dos dados.
Infelizmente a interpretação destes dados até a década de 90
era feita de maneira incorreta e gerou muitos mitos errados que deram origem a
muitas políticas erradas.
Citamos alguns mitos da década de 80:
50% das crianças não chegam a 2ª série;
As crianças não estão nas escolas;
Problema é evasão;
25% dos alunos na 1ª série se evadem;
25% de repetência na 1ª série;
Somente 20% das crianças chegam a 8ª série.
Pretendemos mostrar a origem desses mitos baseados nos erros
de interpretação dos dados, no uso
inadequado da pirâmide educacional e nos conceitos errados de repetente e da
taxa de aprovação. Pretendemos mostrar o modelo de fluxo correto.
Como conseqüência dos mitos, que ressaltavam a evasão e que
as crianças não estavam na escola, a política educacional no Brasil era
construir escola (muitos políticos brasileiros ainda acreditam nisto) e as
famílias eram culpadas por não manterem os filhos na escola.
A partir do final da década de 80, mostrou-se que o grande problema era a repetência e não a
evasão anual. Os alunos não concluíam a 8ª série por ficarem repetindo as
séries anteriores, até serem “expulsos” da escola, mas ficavam em média, mais
de 8 anos na escola. Este diagnóstico muda o enfoque da família para a escola.
As famílias estão mantendo os filhos na escola que não está cumprindo seu papel
adequadamente.
De fato, na década de 80, as matrículas aumentaram muito e
junto houve um aumento da repetência. Somente na década de 90, com a
conscientização do problema da repetência é que as taxas de repetência começam
a cair, enquanto as matrículas continuaram a crescer.
Para ilustrar, fornecemos os dados corretos sobre os mitos,
em 1981:
85% de uma coorte tinham acesso à 2ª série;
83% das crianças de 7 a 14 anos estão na escola (incluindo
pré-escola e ensino médio), 82% estão no ensino fundamental;
Somente cerca de 2% dos alunos se evadiam na 1ª série;
Cerca de 58% repetiam a 1ª série;
Cerca de 37% de uma coorte chegavam a 8ª série.
Houve uma grande evolução e em 2001:
96% de uma coorte tinham acesso à 2ª série,
96% das crianças de 7 a 14 anos estão na escola (incluindo
pré-escola e ensino médio), 93% estão no ensino fundamental;
Somente cerca de 1% dos alunos se evadiam na 1ª série;
Cerca de 32% dos alunos repetem a 1ª série;
Cerca de 62% de uma coorte chegam a 8ª série.
É claro que ainda há muito que melhorar em termos das taxas
de repetência e de conclusão do ensino fundamental.
A qualidade de ensino está sendo avaliada pelo SAEB (Sistema
Nacional de Avaliação da Educação Básica) realizado a cada dois anos desde
1995. O SAEB aplica testes em uma amostra probabilística de alunos das 4ª e 8ª
séries do ensino fundamental e da 3ª série do ensino médio, representativa por
UF e dependência administrativa. Desde 1995, testa Compreensão de Leitura e
Matemática. Em 1997 e 1999 testou também Ciências e em 1999 História e
Geografia. O SAEB também tem questionários para obter informações sobre
características socioeconômicas e culturais e hábitos de estudo dos alunos,
questionários para professores e diretores e sobre as condições das escolas.
Estas variáveis são utilizadas em análises para caracterizar o alunado e para
procurar variáveis associadas ao bom desempenho e que possam ser alvo de ação
da escola e de políticas públicas.
O uso de uma amostra de 3% de um total de cerca de 9 milhões
de estudantes, capaz de traçar um perfil adequado do Ensino Básico, segundo
alguns segmentos de interesse, tais como unidades da federação, rede de ensino
e séries, exige um planejamento cuidadoso e fortemente apoiado pela metodologia
estatística de amostragem. Ilustraremos esses cuidados estatísticos para a
coleta dos dados com os procedimentos empregados no desenho da amostra do SAEB.
O Saeb utiliza a Teoria de
Resposta ao Item (TRI) e os Modelos Lineares Hierárquicos ou Multi-níveis nas análises de seus resultados. A TRI é
utilizada para a estimação das proficiências dos alunos na disciplina para a
qual ele foi selecionado. Esta teoria propõe
modelos matemáticos para representar a relação entre a probabilidade de
um aluno responder corretamente a um item (questão no
teste) e seus traços latentes ou habilidades na área do conhecimento avaliada,
os quais não são observados diretamente. Os modelos dependem do tipo de item e
dos grupos de alunos que estão sendo avaliados. A inclusão de itens comuns
entre anos e entre séries na construção dos testes permite resultados
comparáveis entre séries e ao longo dos anos. Por exemplo, com a inclusão de
itens de 4a. série nos testes da 8a. série e de itens de
8a. série nos testes da 3a. série do ensino médio o SAEB
permite que as proficiências de todos os alunos, independentemente de série,
sejam estimadas na mesma escala de medida. Como o SAEB também utiliza itens
comuns nos testes de diferentes anos, no final do processo de estimação tem-se
que os desempenhos das diferentes séries nos diferentes anos estejam todos
medidos na mesma escala.
Para melhor avaliar uma disciplina/série,
o SAEB utiliza um grande número de itens. O tempo necessário para um aluno
responder a todos estes itens é grande e não é apropriado para este tipo de
avaliação. Por isso, os itens de cada disciplina/série são distribuídos através de um planejamento em
blocos incompletos balanceados (BIB) em diferentes cadernos de teste e o aluno
só responde a um caderno.
Para fazer sentido dos resultados, o SAEB interpreta a
escala em alguns níveis com uma descrição do que os alunos sabem e são capazes
de fazer quando estão naqueles níveis.
Os Modelos Lineares Hierárquicos ou Multi-níveis
são utilizados nas chamadas análises dos
fatores associados ou seja, nas análises para caracterizar o alunado e para
estudar como os fatores de aluno e escola estão associados com o desempenho
desses alunos. Esses modelos são modelos de regressão nos quais a variável
dependente (resposta) é a proficiência, obtida com a TRI,
e as variáveis independentes são obtidas a partir das características de aluno,
professor e escola obtidas a partir dos
questionários aplicados pelo SAEB e de outras pesquisas, como o Censo Escolar.
Eles se diferenciam dos modelos de regressão usuais ao incorporarem em suas
formulações correlações entre proficiências de alunos de uma mesma escola.
Espera-se que alunos de uma mesma escola sejam mais parecidos entre si, em
termos de proficiência, do que alunos de escolas diferentes. Ao incorporar a
hierarquia natural que existe nos dados, alunos dentro de escolas, esta
metodologia de análise permite também que se quantifique o
quanto da variabilidade total apresentada pelas proficiências dos alunos pode
ser atribuída aos alunos e às escolas.
O SAEB e os resultados de fluxo escolar mostram que o Brasil
tem um grande problema de qualidade de ensino, e que o desempenho é mais baixo
nas regiões onde as taxas de repetência são mais altas
Anais da 56ª Reunião Anual da SBPC - Cuiabá, MT - Julho/2004 |