1
Departamento de Matemtica, Universidade de Braslia, Brasil, e-mail: rabelo@unb.br
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
ndice
Introduo 1
1. Os Exames Nacionais de Avaliao Educacional 3
1.1. Contextualizao: do SAEB Prova Nacional de Concurso para o Ingresso na Carreira
Docente 3
1.2. O Sistema de Avaliao da Educao Bsica (SAEB) e a Prova Brasil 4
1.2.1. O que avaliado nas provas 8
1.2.2. Matrizes de Referncia de Matemtica 10
1.2.3. Anlise do desempenho dos estudantes aplicao da TRI 14
1.2.4. Interpretao dos nveis da escala 19
1.2.5. Construo da srie histrica de desempenho 23
1.2.6. O ndice de Desenvolvimento da Educao Bsica (IDEB) 24
1.3. O Exame Nacional do Ensino Mdio (ENEM) 26
1.3.1. Caractersticas do Exame 29
1.3.2. Matriz de Referncia para o ENEM 2009 Matemtica e suas Tecnologias 31
1.3.3. Objetos de conhecimento de Matemtica e suas Tecnologias 33
1.4. O Exame Nacional para Certificao de Competncias de Jovens e Adultos (ENCCEJA) 34
1.5. O Sistema Nacional de Avaliao da Educao Superior (SINAES) 35
1.5.1. O Exame Nacional de Desempenho dos Estudantes (ENADE) 37
1.6. A Provinha Brasil 39
1.7. A Prova Nacional do Concurso para o Ingresso na Carreira Docente 41
2. O que a Teoria de Resposta ao Item? 43
2.1. Contextualizao 43
2.2. O modelo logstico de trs parmetros 44
2.3. A construo da escala de proficincia 49
3. Estimao dos parmetros dos itens e das proficincias 52
3.1. Mtodo de estimao dos parmetros dos itens 52
3.2. Aplicao do mtodo de Newton-Raphson 55
3.3. Estimao das habilidades 57
4. Consideraes finais 60
Referncias bibliogrficas 62
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Prefcio
Introduo
1
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
2
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Captulo 1
3
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
4
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Alunos
Ciclo Escolas
4 srie EF 8 srie EF 3o ano EM Total
1995 2.839 30.749 39.482 26.432 96.663
1997 1.933 70.445 56.490 40.261 167.196
1999 6.798 107.657 89.671 82.436 279.764
2001 6.935 114.512 100.792 72.415 287.719
2003 5.598 92.198 73.917 52.406 218.521
2005 5.940 83.929 66.353 44.540 194.822
Fonte: www.inep.gov.br
Em 2007 e 2009, houve nova aplicao. Em Aplica-se de dois em dois anos. A ltima edio
2011 est planejada sua quarta edio. foi em 2009 e a prxima ser em 2011.
5
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
A Prova Brasil avalia as habilidades em Lngua Alunos fazem prova de Lngua Portuguesa (foco
Portuguesa (foco em leitura) e Matemtica em leitura) e Matemtica (foco na resoluo de
(foco na resoluo de problemas) problemas)
A Prova Brasil avalia as escolas pblicas Avalia alunos de escolas da rede pblica e de
localizadas em rea urbana. escolas privadas, localizadas nas reas urbana e
rural.
A avaliao quase universal: todos os A avaliao amostral, ou seja, apenas parte dos
estudantes das sries avaliadas de todas as estudantes brasileiros das sries avaliadas
escolas pblicas urbanas do Brasil com mais de participam do processo.
20 alunos na srie devem fazer a prova.
Por ser universal, expande o alcance dos Por ser amostral, oferece resultados de
resultados oferecidos pelo SAEB. Como desempenho apenas para o Brasil, regies e
resultado, fornece as mdias de desempenho unidades da Federao.
para o Brasil, regies e unidades da Federao,
para cada um dos municpios e escolas
participantes.
Algumas das escolas que participam da Prova Todos os alunos do SAEB e da Prova Brasil
Brasil ajudam a construir tambm os resultados submetem-se a uma nica avaliao.
do SAEB, por meio de recorte amostral.
6
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
7
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
8
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
9
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
10
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Matemtica, apresenta-se, a seguir, as matrizes de matemtica para cada uma das sries
avaliadas.
11
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
12
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
D19 - Resolver problema com nmeros naturais envolvendo diferentes significados das
operaes (adio, subtrao, multiplicao, diviso e potenciao).
D20 - Resolver problema com nmeros inteiros envolvendo as operaes (adio, subtrao,
multiplicao, diviso e potenciao).
D21 - Reconhecer as diferentes representaes de um nmero racional.
D22 - Identificar frao como representao que pode estar associada a diferentes
significados.
D23 - Identificar fraes equivalentes.
D24 - Reconhecer as representaes decimais dos nmeros racionais como uma extenso do
sistema de numerao decimal identificando a existncia de ordens como dcimos,
centsimos e milsimos.
D25 - Efetuar clculos que envolvam operaes com nmeros racionais (adio, subtrao,
multiplicao, diviso e potenciao).
D26 - Resolver problema com nmeros racionais que envolvam as operaes (adio,
subtrao, multiplicao, diviso e potenciao).
D27 - Efetuar clculos simples com valores aproximados de radicais.
D28 - Resolver problema que envolva porcentagem.
D29 - Resolver problema que envolva variaes proporcionais, diretas ou inversas entre
grandezas.
D30 - Calcular o valor numrico de uma expresso algbrica.
D31 - Resolver problema que envolva equao de segundo grau.
D32 - Identificar a expresso algbrica que expressa uma regularidade observada em
seqncias de nmeros ou figuras (padres).
D33 - Identificar uma equao ou uma inequao de primeiro grau que expressa um problema.
D34 - Identificar um sistema de equaes do primeiro grau que expressa um problema.
D35 - Identificar a relao entre as representaes algbrica e geomtrica de um sistema de
equaes de primeiro grau.
14
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Exemplo 1. O item a seguir foi aplicado aos estudantes do 9. ano (8. srie) para avaliar
se eles seriam capazes de reconhecer as diferentes representaes de um nmero
racional. A partir das anlises de desempenho, verificou-se que o item estaria inserido
no nvel 300 da escala de proficincia (escala com mdia 250 e desvio-padro igual a 50
pontos), ou seja, somente 12,5% dos alunos 9.o ano dominam o contedo avaliado no
item.
Fonte: INEP/MEC
A anlise dos dados acima mostra que o item revelou-se difcil para os
respondentes, pois somente 27% deles acertaram. O item teve alta discriminao e alto
coeficiente bisserial. A opo errada (C) atraiu 56% dos alunos, evidenciando que esses
alunos no dominam os conceitos de nmeros decimais e fraes. Provavelmente, essa
opo foi escolhida por conter os nmeros 2 e 5, que aparecem no enunciado (0,25).
Exemplo 2. O item a seguir foi aplicado aos estudantes do 3.o ano do ensino
mdio para avaliar se eles seriam capazes de identificar a localizao de nmeros
racionais na reta numrica. A partir das anlises de desempenho, verificou-se que o item
estaria inserido no nvel 375 da escala de proficincia, de onde se conclui que apenas
6,85% dos estudantes brasileiros do fim da escolaridade bsica dominam esse contedo.
15
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Fonte: INEP/MEC
Este item exige a converso de frao em decimal. Foi um item muito difcil
para os estudantes, com apenas 26% de acerto, sendo que o percentual de acerto do
grupo superior foi de 50% e o do grupo inferior 15%. A opo (A), que corresponde ao
ponto -2.5, atraiu 61% dos alunos e foi a alternativa modal at o nvel 350 de
proficincia. incrvel que no 3. ano do EM uma quantidade enorme de alunos ainda
identifique a frao 2/5 com o nmero 2,5.
Ainda com relao aos resultados das aplicaes das provas, cabe ressaltar que
as anlises estatsticas clssicas, que permitem atribuir nota aos respondentes de um
teste, apresentam algumas limitaes, pois ficam restritas a um determinado momento, a
um determinado teste e ao grupo que respondeu prova, dificultando o
acompanhamento pedaggico ao longo dos anos. Para acompanhar a evoluo dos
16
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
alunos e estabelecer comparaes entre sries diferentes ou mesmo entre grupos que
responderam a provas diferentes, foi necessrio desenvolver uma outra metodologia de
construo do processo e de anlise dos dados gerados aps aplicao dos instrumentos.
O modelo utilizado vem da psicometria moderna a Teoria de Resposta ao Item (TRI).
Pela TRI, o grau de conhecimento dos alunos obtido por meio das caractersticas dos
itens, de modo que alunos que acertam um mesmo nmero de itens de uma prova
podem receber notas diferentes em razo de caractersticas especficas dos itens
acertados. Essas caractersticas incluem a discriminao, a dificuldade e a probabilidade
de acerto ao acaso, que sero explicadas em mais detalhes posteriormente.
Por meio dessas caractersticas, a TRI permite medir o nvel de proficincia de
cada aluno e, a partir dessa unidade de medida, construir uma escala. Essa uma das
grandes vantagens da TRI em relao teoria clssica dos testes (TCT). Com a criao
dessa escala, alunos submetidos a diferentes provas podem ser comparados entre si.
Contudo, para que essa comparao seja legtima, necessrio realizar uma
equalizao, ou seja, necessrio transformar as medidas (parmetros dos itens e
desempenho dos alunos) para que elas fiquem em uma mesma escala. Por meio dessas
anlises, pode-se aferir o nvel em que uma escola se encontra na escala de proficincia
das disciplinas e dos nveis de ensino avaliados, no que concerne s habilidades
desenvolvidas pelos alunos. Isso nos permite fazer comparaes e acompanhar
progressos de um sistema educacional ao longo dos anos. importante enfatizar que as
escalas de proficincia tm carter cumulativo, ou seja, os alunos que possuem domnio
em um conjunto de habilidades de um nvel tm alta probabilidade de serem
proficientes nas habilidades anteriores a esse nvel da escala.
Com isso, compara-se o desempenho dos alunos nas sries e disciplinas
avaliadas no percurso de seu desenvolvimento escolar. Com o uso dessa tcnica, os
resultados do SAEB e da Prova Brasil so apresentados em escalas de proficincia por
disciplina, que descrevem habilidades que os alunos so capazes de demonstrar nos
diversos nveis que compem as escalas. As habilidades so cumulativas e vo se
tornando mais complexas medida que se avana na escala.
Para permitir a comparabilidade ao longo dos anos, as provas de um ano incluem
alguns itens da aplicao anterior, chamados de itens de ligao. A partir desses itens
comuns que se faz a equalizao de resultados de um ciclo para o outro, processo
chamado de equalizao de grupos no equivalentes com itens comuns. Na montagem
17
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
18
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
125 Neste nvel, os alunos da 4 e da 8 srie resolvem problemas de clculo de rea com base na
contagem das unidades de uma malha quadriculada.
19
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Na 8 srie:
identificam quadrilteros pelas caractersticas de seu lados e ngulos;
calculam o permetro de figuras sem o apoio de malhas quadriculadas.
20
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Na 8 srie:
21
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
resolvem problemas:
identificando a lateralidade de um objeto, tendo por referncia
pontos com posio oposta sua e envolvendo combinaes;
realizando converso e soma de medidas de comprimento e
massa (m/km e g/kg).
identificam mais de uma forma de representar numericamente uma mesma frao e
reconhecem fraes equivalentes;
identificam um nmero natural (no informado) relacionando-o a uma demarcao na
reta numrica.
Na 8 srie:
resolvem problemas:
calculando a ampliao, reduo ou conservao da medida
(informada inicialmente) de ngulos, lados e rea de figuras planas;
para clculo numrico de uma expresso algbrica em sua forma
fracionria;
envolvendo porcentagens diversas e suas representaes na forma
fracionria;
de adio e multiplicao, envolvendo identificao de um sistema de
equaes do primero grau com duas variveis.
22
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
350 Alm das demais habilidades demonstradas no nvel anterior, neste nvel, os alunos da 8 srie:
23
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Fonte: INEP/MEC
Fonte: INEP/MEC
24
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
e
em que
i = ano do exame (SAEB e Prova Brasil) e do Censo Escolar;
= mdia da proficincia em Lngua Portuguesa e Matemtica, padronizada
para um indicador entre 0 e 10, dos alunos da unidade j, obtida em determinada
edio do exame realizado ao final da etapa de ensino;
= indicador de rendimento com base na taxa de aprovao da etapa de ensino
dos alunos da unidade j.
Por exemplo, se uma escola, em uma srie, obteve uma mdia padronizada de
7,0 na Prova Brasil, e o tempo mdio de concluso de cada srie de um ano, ento seu
IDEB ser igual a 7,0 = 7,0 1/1. J uma escola cuja mdia foi 7,0 e cujo tempo mdio
de concluso de cada srie de dois anos ter um IDEB de 3,5 = 7,0 1/2.
Ainda de acordo com Fernandes,
25
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
com esforo maior daqueles que partem em pior situao, com um objetivo
implcito de reduo da desigualdade educacional.
A definio de uma meta nacional para o IDEB em 6,0 significa dizer
que o pas deve atingir em 2021, considerando os anos iniciais do ensino
fundamental, o nvel de qualidade educacional, em termos de proficincia e
rendimento (taxa de aprovao), da mdia dos pases desenvolvidos (mdia dos
pases membros da OCDE) observada atualmente. Essa comparao
internacional foi possvel devido a uma tcnica de compatibilizao entre a
distribuio das proficincias observadas no PISA (Programme for
Internacional Student Assessment) e no SAEB.
A meta nacional norteia todo o clculo das trajetrias intermedirias
individuais do IDEB para o Brasil, unidades da Federao, municpios e
escolas, a partir do compartilhamento do esforo necessrio em cada esfera para
que o Pas atinja a mdia almejada no perodo definido. Dessa forma, as metas
intermedirias do IDEB, com incio em 2007, foram calculadas nos mbitos
nacional, estadual, municipal e para cada escola, a cada dois anos.
26
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
27
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
28
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
apenas pela ordenao dos itens. A linha de base da equalizao dos resultados so os
parmetros originados no pr-teste. A interpretao da escala de proficincia tem sido
elaborada, mas ainda no foi divulgada porque nem todas as faixas da escala possuam
itens que possibilitassem sua interpretao.
O impacto do exame na sociedade grande, pois o nmero de inscritos supera os
4,5 milhes de indivduos. A adeso ao exame como forma de substituio do
tradicional vestibular tem crescido ao longo dos anos, e isso um dos grandes atrativos,
j que a escolha do curso e da instituio podem ser feitas a posteriori da divulgao
dos resultados de desempenho, por meio de um sistema informatizado que armazena at
5 escolhas de cada candidato, para, posteriormente, alocar os pretendentes nas
instituies e cursos selecionados. Recentemente, o Conselho Universitrio da
Universidade Federal do Rio de Janeiro, uma das maiores do pas, decidiu adotar o
ENEM como forma exclusiva de acesso a seus cursos de graduao a partir de 2012.
Isso dever estimular outras grandes instituies a fazer o mesmo.
I - oferecer uma referncia para que cada cidado possa proceder sua auto-
avaliao com vistas s suas escolhas futuras, tanto em relao ao mundo do
trabalho quanto em relao continuidade de estudos;
III - estruturar uma avaliao ao final da educao bsica que sirva como
modalidade alternativa ou complementar aos exames de acesso aos cursos
profissionalizantes, ps-mdios e Educao Superior;
29
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
31
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
32
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
33
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
34
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
35
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
36
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
37
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
38
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
40
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
41
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
42
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Captulo 2
2.1 Contextualizao
A TRI surgiu entre os anos 50 e 60 do sculo passado para responder a
indagaes relativas aos testes de inteligncia, cujos resultados variavam em funo dos
instrumentos de medida utilizados. Qual seria ento o resultado correto? O problema era
mais profundo j que o objeto medido, a inteligncia no caso, afeta diretamente o
instrumento utilizado; alis, ela definida pelo prprio instrumento utilizado (Pasquali,
2007). J pensou se o metro medisse de forma diferente se estivssemos calculando a
largura de um livro ou o comprimento de uma mesa? A soluo dada pela TRI a esse
problema independncia do instrumento de medida em relao ao objeto que se deseja
medir utilizava modelos e algoritmos matemticos difceis de serem operacionalizados
poca. Por isso, somente aps o avano tecnolgico dos anos 80, com o
desenvolvimento de softwares para uso prtico dos algoritmos complexos que o modelo
contm, essa teoria comeou a ser difundida.
A utilizao da TRI para anlise de testes de conhecimento veio para sanar
algumas limitaes da Teoria Clssica dos Testes (TCT), principalmente no que diz
respeito a discriminao dos itens, fidedignidade dos testes e comparabilidade de
desempenho de indivduos que se submetem a testes diferentes. Tomando as edies do
ENEM j ocorridas desde 1998, comum ouvirmos inferncias comparativas dos
resultados de um ano com o seguinte, simplesmente observando-se a mdia dos alunos
na prova. Essas comparaes so completamente desprovidas de fundamento e no
podem ser feitas. Os resultados de um ano para o outro no so comparveis. Com a
utilizao da TRI no ENEM, podero ser tiradas concluses interessantes e
cientificamente bem fundamentadas sobre o desempenho dos estudantes e dos egressos
do ensino mdio brasileiro ao longo do tempo.
Uma escala de proficincia para cada uma das quatro reas avaliadas ser
construda, e essa ser a rgua que vai ser utilizada para se comparar os resultados ao
longo dos anos. Ser possvel fazer concluses anlogas ao que hoje j inferido a
partir dos dados obtidos com o SAEB e a Prova Brasil. Conforme comentamos no
captulo anterior, at 1993, o SAEB utilizou a TCT para a construo dos instrumentos,
43
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
atribuio dos escores e anlise dos resultados, no havendo planejamento para uma
comparao dos resultados. A partir de 1995, foi introduzido o uso da TRI para a
construo de instrumentos, a atribuio de escores e a anlise, de forma a viabilizar a
comparao dos resultados, com a construo das escalas de proficincia. A experincia
de utilizao dessa metodologia no Brasil j tem, portanto, cerca de 15 anos.
2
Neste texto, vamos usar indistintamente as palavras aptido, habilidade e proficincia.
44
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
possam estar correlacionados, mas que cada indivduo d respostas independentes para
cada item do teste.
Quando um indivduo responde a uma sequncia de itens, produz um padro de
respostas, composto de acertos (valor = 1) e erros (valor = 0). Isso pode ser
esquematizado em uma tabela cujas linhas so os padres de respostas dos indivduos
submetidos ao teste e cujas colunas so os itens do teste, numerados, por exemplo, de 1
a 45 (o novo ENEM composto de quatro provas de 45 itens cada uma). Essa tabela de
uns e zeros coleciona as respostas dadas por todos os indivduos a todos os itens de
cada prova. Se forem 4,5 milhes de participantes, ser, para cada rea avaliada, uma
tabela de 4,5 milhes de linhas por 45 colunas, chamada de matriz de padro de
respostas dos indivduos. Somente com os recursos atuais de informtica podemos
manusear tabelas to grandes.
Na TCT, a aptido de um indivduo que respondeu ao teste simplesmente
expressa pelo nmero de itens que ele acertou. Compara-se seu padro de respostas com
o gabarito e calcula-se o escore bruto fazendo-se a soma dos acertos. No caso da TRI,
deseja-se descobrir qual o valor do trao latente (da habilidade) do indivduo que
explica o acerto ou o erro em cada item individualmente.
Para descobrir isso, a pergunta inicial que a TRI faz sobre o item : qual a
probabilidade de um dado indivduo acertar um item especfico? A resposta a essa
pergunta depende do nvel de aptido do indivduo () e das caractersticas do item
dificuldade (b), discriminao (a) e acerto ao acaso (c).
Entre os modelos propostos pela TRI, o modelo logstico unidimensional de 3
parmetros mais utilizado e representa a probabilidade de um indivduo j responder
corretamente um item i, sendo definido por:
(1 ci )
PX ij 1 | j ci ,
1 exp[ Dai ( j bi )]
em que
X ij a resposta ao item i (igual a 1, se o indivduo responde
corretamente, e igual a 0, caso contrrio);
ai > 0 o parmetro de discriminao do item i,
bi o parmetro de posio (ou de dificuldade) do item, medido na
mesma escala da habilidade;
45
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
O nmero P X ij 1 | j pode ser identificado com a proporo de respostas
equao acima est descrita pela curva da figura abaixo, chamada de Curva
Caracterstica do Item (CCI).
Logo, na TRI, estuda-se o comportamento do indivduo frente a cada item que
ele responde. Por isso, a base
desse modelo matemtico a
CCI, grfico da funo P(), que
fornece a probabilidade de um
aluno com habilidade
responder corretamente o item do
teste que est sendo analisado. A
funo P() assume valores que
vo de 0 a 1 (correspondentes a
0% a 100%) e se configura em
uma curva na forma de S. Na
curva, esto indicados os
parmetros a, b, c do item, que sero explicados a seguir. Os valores da habilidade (),
no eixo horizontal, esto na escala de mdia igual a zero e desvio-padro 1.
O acerto ao acaso representa as respostas dadas por chute. Isso ocorre
principalmente com os itens que so mais difceis, para os quais indivduos de baixa
aptido no conhecem a resposta correta, mas arriscam qualquer uma. A TRI estima o
acerto ao acaso por meio do parmetro c, que representa a probabilidade de um aluno
com baixa habilidade responder corretamente o item. Assim, se no fosse permitido
chutar, c seria igual a zero. Em geral, so recomendados valores iguais ou inferiores a
0,20 para itens com 5 opes de resposta, como o caso do ENEM.
46
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
47
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Vamos ilustrar a situao terica descrita acima em um caso real, para um item
aplicado no ENEM de 2007.
Exemplo.
Representar objetos tridimensionais em uma folha de papel nem
sempre tarefa fcil. O artista holands Escher (1898-1972)
explorou essa dificuldade criando vrias figuras planas
impossveis de serem construdas como objetos tridimensionais,
a exemplo da litografia Belvedere, reproduzida ao lado.
Considere que um marceneiro tenha encontrado algumas figuras
supostamente desenhadas por Escher e deseje construir uma
delas com ripas rgidas de madeira que tenham o mesmo
tamanho.
A B C
D E
A curva caracterstica desse item est ilustrada abaixo. Os parmetros do item, obtidos
utilizando-se a TRI, so a = 1,31, b = 0,96 e c = 0,15.
A forma da curva j diz bastante sobre
o comportamento desse item, que
apresentou bons parmetros:
discriminou muito bem (a = 1,31), est
na faixa de mdia para alta dificuldade
(b = 0,96) e o parmetro de acerto ao
acaso ficou abaixo do mximo
permitido (c = 0,15).
Para responder ao item, o candidato
deveria, por meio de uma habilidade
de percepo espacial adequada,
analisar as figuras tridimensionais
dadas e verificar em qual delas as
Fonte: Inep/MEC relaes de visibilidade e
sombreamento entre as peas de
madeira correspondiam a um objeto
real.
48
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Os valores dos parmetros dos itens e das habilidades dos indivduos so obtidos
utilizando-se tcnicas estatsticas e matemticas de estimao, com o auxlio de
softwares especficos, que manipulam tabelas (matrizes) gigantescas como a matriz de
padro de respostas anteriormente mencionada. De qualquer modo, em uma populao
to grande quanto a que se submete ao ENEM ou Prova Brasil, a distribuio dos
indivduos por nvel de habilidade praticamente normal, conforme ilustra
hipoteticamente a figura a seguir.
49
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
50
II Colquio de Matemtica da Regio Centro-Oeste, 7 a 10 de novembro de 2011
Universidade Federal do Mato Grosso
Este critrio bastante rgido, e, por isso, uma modificao tem sido empregada:
65% ou mais dos respondentes em torno do nvel 400 acertam o item;
menos de 65% dos alunos posicionados no nvel anterior acertam o item; e
o ajuste da curva CCI bom.
51
Captulo 3
Estima
c
ao dos par
ametros dos itens e das profici
encias
3.1 M
etodo de estima
c
ao dos par
ametros dos itens
Para fins de ilustrar o procedimento basico da TRI para resolver esse pro-
blema, trataremos nesta secao da estimacao dos parametros dos itens quando as
habilidades sao conhecidas, utilizando o metodo da maxima verossimilhanca (ma-
ximum likelihood ), ja que as probabilidades serao calculadas a partir dos dados ja
coletados, empricos, ou seja, a posteriori. Em seguida, estimaremos as habilida-
des supondo conhecidos os parametros dos itens. Os resultados aqui apresentados
foram adaptados de Andrade et al (2000).
O metodo da maxima verossimilhanca e um processo que busca descobrir
o valor de que maximiza a verossimilhanca de ocorrer um padrao de respostas
aos itens, obtido por parte de determinado indivduo. Isto e, dado um padrao de
respostas, por exemplo, 111100001100111, determinar a poscao mais verossmil
que o sujeito ocupa no contnuo dos s, isto e, qual o nvel de aptidao mais provavel
do sujeito que obteve tal padrao de respostas.
Para desenvolver todo o procedimento, sao feitas duas hipoteses fundamen-
tais:
a) independencia das respostas oriundas de indivduos diferentes;
52
Dito de outro modo, para examinandos com uma dada aptidao, a probabilidade
de obter um padrao de respostas a um conjunto de itens e igual ao produto das
probabilidades das respostas de cada item. Embora pareca improvavel que as
respostas de um mesmo indivduo nao estejam correlacionadas, a independencia
local afirma que, se houver correlacao, esta sera devida a` influencia de fatores
diferentes da aptidao () que esta sendo medida. Se esses outros fatores forem
controlados, isso significa que o indivduo responde exclusivamente em funcao do
tamanho de seu , ja que a u nica causa de resposta do sujeito e esse suposto
dominante. Como a unidimensionalidade do teste - homogeneidade do conjunto de
itens que, supostamente, devem estar medindo um u nico traco latente - implica a
independencia local (ver Hambleton & Swaminathan, 1991), se os itens forem ela-
borados de modo a satisfazer a suposicao de unidimensionalidade, entao a segunda
hipotese anteriormente estabelecida e automaticamente satisfeita.
Logo, assumindo as hipoteses acima como verdadeiras, a probabilidade de um
conjunto de n indivduos j dar uma resposta Xj = (xj1 , xj2 , ...xjl ) a um conjunto l
de itens, levando-se em consideracao a aptidao j de cada um e os parametros dos
itens i =ai , bi ou ci , e dada por:
n Y
Y I
L() = P (Xji = xji |j , i )
j=1 i=1
n Y
Y I
= P (Xji = 1|j , i )xji P (Xji = 0|j , i )1xji
j=1 i=1
n Y
I
x 1xji
Y
= Pjiji Qji , (1)
j=1 i=1
53
n
log L X (log Pji ) (log Qji )
= xji + (1 xji )
i j=1
i i
n
X 1 Pji 1 Pji
= xji (1 xji )
j=1
Pji i Qji i
n
X 1 1 Pji
= xji (1 xji )
j=1
Pji Qji i
n
X xji Pji Pji
= .
j=1
Pji Qji i
Usando a notacao
Pji Qji
Wji = ,
Pji Qji
em que
Pji = {1 + eDai (j bi ) }1 e Qji = 1 Pji ,
obtemos, para cada um dos parametros do item i, as derivadas parciais de primeira
ordem da funcao log-verossimilhanca dadas por:
n
log L X Pji Wji
= (xji P ji)
ai j=1
ai Pji Qji
n
Wji
X
= (xji Pji )D(1 ci )(j bi )Pji Qji
j=1
Pji Qji
n
X
= D(1 ci ) (xji Pji )(j bi )Wji .
j=1
n
log L X Pji Wji
= (xji P ji)
ai j=1
ai Pji Qji
n
Wji
X
= (xji Pji )(1)Dai (1 ci )Pji Qji
j=1
Pji Qji
n
X
= Dai (1 ci ) (xji Pji )Wji .
j=1
n
log L X Pji Wji
= (xji Pji )
ci j=1
ai Pji Qji
n
Wji
X
= (xji Pji )Qji
j=1
Pji Qji
n
X Wji
= (xji Pji ) .
j=1
Pji
54
Assim, as equacoes de estimacao para os parametros ai , bi , ci sao, respecti-
vamente,
n
X
(xji Pji )(j bi )Wji = 0, (3)
j=1
n
X
(xji Pji )Wji = 0, (4)
j=1
n
X Wji
(xji Pji ) = 0. (5)
j=1
Pji
Na maioria das vezes, as condicoes obtidas das derivadas de primeira ordem
para o problema de maximizacao da funcao de verossimilhanca nao permitem a
obtencao de uma solucao explcita para os estimadores em questao. O sistema
de equacoes gerado e quase sempre nao linear, obrigando que a maximizacao seja
feita por algum processo numerico. Os procedimentos de otimizacao numericos
funcionam de forma recursiva, sendo os valores dos parametros na etapa k + 1
uma funcao de seus valores na etapa k. O algoritmo numerico consiste em tentar
um valor para cada parametro e, depois, corrigi-lo sucessivamente ate que algum
criterio de convergencia seja atendido, quando, entao, chega-se a um maximo para
a funcao de verossimilhanca. Em alguns casos, quando nao ocorre convergencia,
o processo de iteracao tem de ser interrompido depois de um n umero de iteracoes
preestabelecido. Isso e exatamente o que ocorre com as equacoes (3), (4) e (5),
que nao possuem solucao explcita. Podemos, por exemplo, utilizar o metodo de
Newton-Raphson para fazer as estimacoes desejadas. Este e o tema da secao seguir.
3.2 Aplica
cao do m
etodo de Newton-Raphson
O metodo de Newton-Raphson foi introduzido para resolver equacoes do tipo
f (x) = 0, encontrando, por meio de sucessivas iteracoes, valores que se aproximam
cada vez mais da solucao. De modo geral,
f (xk+1 )
xk+1 = xk ,
f 0 (xk )
considerando-se a etapa k e a aproximacao seguinte. Esse processo iterativo e
continuado ate que o valor absoluto da diferenca xk+1 xk seja pequeno o suficiente
ou ate que seja feito um n
umero maximo de iteracoes preestabelecido.
No nosso caso, a funcao l() = log L() possui varias variaveis, i , com
i = 1...3l, e precisaremos encontrar os valores dos parametros que anulam as
primeiras derivadas de l(), o que corresponde a obter as solucoes das equacoes de
0
estimacao dos parametros. Tomando valores iniciais i = (a0i , b0i , c0i )0 , a primeira
1 0 0
estimativa pode ser escrita como i = i + i , isto e,
ai 1 = ai 0 + ai 0 ,
1 0 0
bi = bi + bi , (6)
ci 1 = ci 0 + ci 0 ,
55
0
em que ai 0 , bi , e ci 0 sao erros de aproximacao. Fazendo a expansao em serie
0
de Taylor de l()/i em uma vizinhanca de i , obtemos
l l 0 2l 0
2
0 l 0 2l 0
() = (i ) + ai 0 2 (i ) + bi (i ) + ci 0 (i ) + Rai
ai ai ai ai bi ai ci
l l 0 2 2 2
0 l
() = (i ) + bi (i 0 ) + bi 0 l (i 0 ) + ci 0 l (i 0 ) + Rb
bi bi b2i bi ai bi ci i
l l 0 2l 0 2
0 l 0 2l 0
() = (i ) + ai 0 2 (i ) + bi (i ) + ci 0 (i ) + Rci ,
ci ci ci ci ai ci bi
Nessas expressoes, estamos usando que l/i e uma funcao apenas de i , nao
dependendo de l para l 6= i.
Vamos agora introduzir a seguinte notacao
l 2l 2l 2l
L1 = L11 = L12 = L13 = ,
ai a2i ai bi ai ci
l 2l 2l 2l
L2 = L21 = L22 = 2 L23 = ,
bi bi ai bi bi ci
l 2l 2l 2l
L3 = L31 = L32 = L33 = 2 ,
ci ci ai ci bi ci
0
em que todas as funcoes sao avaliadas no pontos (i ). Desprezando os restos no
desenvolvimento de Taylor, obtemos
0
0 = L1 + L11 ai 0 + L12 bi + L13 ci 0 ,
0
0 = L2 + L12 ai 0 + L22 bi + L23 ci 0 ,
0
0 = L3 + L13 ai 0 + L23 bi + L33 ci 0 .
O sistema acima pode ser escrito, em notacao matricial, do seguinte modo:
ai 0
L1 L11 L12 L13
0
L2 = L21 L22 L23 bi .
L3 L31 L32 L33 ci 0
Assim, a primeira estimacao para os parametros pode ser obtida pela seguinte
equacao 1 0 1
ai ai
L11 L12 L13 L1
bi 1 = bi 0 L21 L22 L23 L2 .
ci 1 ci 0 L31 L32 L33 L3
1
Como o processo e iterativo, apos obtido i , considera-se este o novo valor
2
inicial para a obtencao de i , repetindo-se o processo ate que algum criterio de
parada seja alcancado.
Para explicitar os valores de Lkl , com k, l = 1, 2, 3, precisamos calcular as
derivadas de segunda ordem de l = log L em relacao a i . Fazendo isso, obtemos
n 0 2
log L X xji Pji Pji xji Pji Pji
0 = + 0 .
i i j=1
i Pji Qji i Pji Qji i i
56
Calculando a derivada do quociente explicitado no primeiro termo do somatorio
acima, encontramos
xji Pji
=
i Pji Qji
1 Pji Pji Qji
= Pji Qji (xji Pji )
(Pji Qji )2 i i
1 Pji Pji Pji
= Pji Qji + (xji Pji ) 2Pji
(Pji Qji )2 i i i
1 Pji
= 2
{Pji Qji + (xji Pji )(1 2Pji )}
(Pji Qji ) i
1 2 Pji
= (x ji P ji ) .
(Pji Qji )2 i
A ultima igualdade segue do fato que xji = x2ji , ja que xji assume somente os
valores 0 e 1. Substituindo esse resultado na equacao anterior, obtemos o resultado
desejado. Fazendo iteracoes sucessivas, chegamos aos valores de estimacao com a
aproximacao que for pre-fixada.
3.3 Estima
c
ao das habilidades
Nesta secao, vamos tratar da estimacao das habilidades quando os parametros
dos itens sao conhecidos. Os itens ja podem ter vindo de algum processo de pre-
testagem ou optou-se mesmo pela estimacao em separado.
Usando novamente as hipoteses da independencia entre as respostas de dife-
rentes indivduos e da independencia local, podemos escrever a log-verossimilhanca
como em (2), agora como funcao de e nao de , ou seja,
n X
X I
log L() = {xji log Pji + (1 xji ) log Qji }. (7)
j=1 i=1
57
I
log L X (logPji ) (logPji )
= xji + (1 xji )
j i=1
j j
I
X 1 Pji 1 Pji
= xji (1 xji )
i=1
Pji j Qji j
I
X 1 1 Pji
= xji (1 xji )
i=1
Pji Qji j
I
X xji Pji Pji
=
i=1
Pji Qji j
I
X Wji Pji
= (xji Pji ) ,
i=1
P ji Qji j
Como
Pji
= Dai (1 ci )Pji Qji ,
j
obtemos
I
log L X
Wji
= (xji Pji )Dai (1 ci )Pji Qji
j i=1
Pji Qji
I
X
= D ai (1 ci )(xji Pji )Wji .
i=1
Assim como nas equacoes (3), (4) e (5), a equacao (8) tambem nao apresenta
solucao explcita para j e, por isso, precisamos de algum metodo iterativo para
obter as estimativas desejadas. Com raciocnio analogo ao feito com os parametros
k
dos itens e considerando j a estimativa de j na iteracao k do metodo de Newton-
Raphson, obtemos
58
e
I
( 2 )
2 log L
X xji Pji x ji P ji
= (Pji Qji )Hji (Pji Qji )2 h2ji
i2 i=1
P Q
ji ji P Q
ji ji
XI
= (xji Pji )Wji {Hji (xji Pji )Wji h2ji }
i=1
com
Pji
hji = (Pji Qji )1 = Dai (1 ci )
j
e 2
1 Pji
Hji = (Pji Qji ) = D2 a2i (1 ci )(1 2Pji ).
j2
Esses calculos ilustram a metodologia subjacente a` teoria de resposta ao item.
Ha muitas situacoes a serem consideradas, nao somente a respeito da estimacao
de parametros e habilidades mas tambem sobre erro padrao das medidas, proble-
mas de convergencia dos metodos, aplicacoes de testes a mais de um grupo de
indivduos, aplicacoes de testes a grupos diferentes mas com itens-ancora, equa-
lizacao dos resultados, vies de itens, multidimensionalidade dos testes, fidedigni-
dade, validade,vies, modelos para itens nao dicotomicos etc. O leitor que desejar
explorar mais detalhes matematicos relativos `a teoria encontrara em Andrade et
al (2000) uma excelente fonte de leitura.
59
Captulo 4
Consideraes Finais
A realidade brasileira mostra milhes de crianas e jovens que, ano aps ano,
experimentam o desnimo, a frustrao e o abandono escolar. Isso sugere que,
subjacente avaliao, h uma teia de significados que merecem ser considerados em
dimenses amplas e diversificadas e que refletem a complexidade da prpria
subjetividade dos atores envolvidos: quem avalia e quem avaliado. O processo no
neutro e sofre influncia das relaes sociais estabelecidas dentro e fora do contexto
escolar.
A anlise feita nestas notas mostra que o Brasil j acumula uma experincia
considervel com relao aos processos de avaliao de larga escala e revela a
complexidade das diversas etapas dos processos, que engloba a qualidade dos
instrumentos utilizados, as estratgias e situaes pelas quais se obtm informaes
acerca do aprendizado dos estudantes e os mtodos utilizados para interpretar o
desempenho. O INEP, desde a criao do SAEB, em 1990, vem produzindo indicadores
sobre o sistema educacional brasileiro. Alguns deles apontam para problemas graves na
eficincia do ensino oferecido pelas redes de escolas brasileiras, como os baixos
desempenhos em leitura e na apreenso de conceitos bsicos de matemtica, por
exemplo. Em face de tal realidade, o governo federal e muitos governos estaduais e
municipais tm empreendido esforos para reverter esse quadro. Nesse sentido, a opo
pelo uso da TRI para a construo de bancos de itens calibrados e de escalas de
proficincia comparveis ao longo do tempo proporciona inferncias relevantes com
relao s aprendizagens dos estudantes e anlise da eficcia das aes de melhoria da
qualidade de ensino implantadas.
60
na avaliao da educao bsica e impem a necessidade de aprofundamento nos
modelos de instrumentos utilizados e nas estratgias de coleta de dados.
Apesar dos avanos alcanados ao longo desses anos, muitos obstculos ainda
precisam ser transpostos, principalmente em um pas de dimenses continentais e que
possui a quinta maior populao mundial, com desigualdades profundas no que se
referem formao e acesso a cultura, educao e uso de novas tecnologias. Isso coloca
a necessidade de cada vez mais se fazer uma avaliao consistente com os desafios
curriculares da educao contempornea e de se criarem metodologias de ensino que
efetivamente contemplem alguma possibilidade de mudana qualitativa.
Enfim, fazer com que o processo se aproxime cada vez mais daquilo que os
educadores esperam da avaliao, mesmo que seja de larga escala: que ela esteja a
servio da aprendizagem.
61
Referncias Bibliogrficas
ANDRADE, D.F., TAVARES, H.R. & VALLE, R.C. Teoria da resposta ao item:
conceitos e aplicaes. So Paulo: ABE Associao Brasileira de Estatstica, 2000.
_______. O ENEM e os desafios da correo das redaes. In: ANDRADE, G.G. &
RABELO, M.L. (org.) A Produo de Textos no ENEM: desafios e conquistas. Braslia:
EdUnB. (Desafios e Conquistas, vol. 1), 2007.
BEATON, A.E., ALLEN, N.L. Interpreting scales through scale anchoring. Journal of
Educational Statistics, v.17, p.191-204, 1992.
62
_______. Ministrio da Educao. ENEM - Exame Nacional do Ensino Mdio.
Documento Bsico, 2000. Braslia: Inep/MEC, 1999.
63
RABELO, M.L. A matriz de matemtica do SAEB e o contexto escolar. Pesquisa &
Avaliao: Revista da Escola SAERJ 2009, 1, 20-27, 2010.
RABELO, M.L. Matriz de referncia como centro dos processos de avaliao em larga
escala. Pesquisa & Avaliao: Revista do Professor: SADEAM 2010: Matemtica e
suas tecnologias, 2, 2011.
64
65