Análises de dados podem ajudar a combater fraudes no Enem (Exame Nacional do Ensino Médio), segundo mostrou reportagem da Folha de S. Paulo em abril. Daniel Mariani, um dos autores, conta no “Fala, Jornalista”, o podcast da Jeduca, como foi o longo trabalho que analisou 3 milhões de gabaritos da prova.
Mariani é um cientista de dados (tem formação em Biologia) e trabalha no Núcleo de Inteligência da Folha, o grupo destinado a fazer matérias com esse perfil. Suas pesquisas – reforçadas depois por investigações jornalísticas – descobriram possíveis esquemas de fraude entre 2011 e 2016. A matéria mostrou que mais de mil provas tinham padrões de respostas tão semelhantes entre si que, estatisticamente, é improvável que não tenha havido algum tipo de fraude.
As informações sobre os gabaritos constam nos chamados microdados do Enem, disponibilizados pelo Inep (Instituto Nacional de Estudos e Pesquisas Educacionais), responsável pelo exame. No banco, estão todas as respostas de todos os candidatos no exame, onde eles fizeram a prova, onde residiam à época da avaliação. Os candidatos não são identificados pelo nome ou CPF.
“As ferramentas atuais permitem identificar um maior número de fraudes. Conseguem mostrar também pessoas que fraudaram o exame no passado”, diz Mariani. O resultado não foi uma surpresa; Mariani conta que esperava encontrar possíveis fraudes. O que surpreendeu foi que nem o Inep nem a Polícia Federal haviam identificado esses esquemas. Procurada pela reportagem, de acordo com Mariani, a autarquia informou que identificou, no mesmo período, apenas 14 fraudes, cerca de 1% do que a Folha levantou.
A partir de cruzamentos, a reportagem descobriu ainda que algumas dessas pessoas ingressaram no ensino superior, em cursos concorridos, como Medicina. “Esperaria que fosse possível voltar atrás e corrigir esse erro de alguma forma, que eles buscassem isso”, diz.
A Jeduca procurou o Inep, que em nota, disse que, além dos 14 casos, “há outros inquéritos policiais em curso. Caso haja indicação de fraude devidamente formalizada pela autoridade policial, os participantes envolvidos serão eliminados do Enem, sem prejuízo de outras providências”.
A autarquia diz que fornece à Polícia Federal relatórios de análise estatística dos resultados coincidentes obtidos pelos participantes, que “servem para balizar estratégias de atuação nas investigações que se fazem necessárias”. O Inep acrescenta que o edital do Enem não prevê a eliminação do participante por resultados coincidentes.
Para a produção da reportagem foram necessários três meses de trabalho e uma equipe de quatro jornalistas. No podcast, Mariani conta como foi esse processo e o que aprendeu ao trabalhar com uma base de dados tão grande em educação. Ele dá também dicas para quem quer trabalhar com jornalismo de dados.