Pages

Sunday, October 31, 2010

Interpretação estatística de resultados

Há poucas coisas tão importantes na ciência quanto a arte de interpretar resultados. Tomemos, por exemplo, as eleições de segundo turno para presidente realizada no dia 31 de outubro de 2010.

Um mapa comum apresentado por várias fontes, como na cobertura do G1, é apresentado abaixo.
Se ainda não percebeu, esse gráfico possui uma péssima representação visual. Ele fornece um panorama de vitória pelo estado e utiliza uma escala de cores inadequada para os valores apresentados.

Resumindo, olhando para esse gráfico, é possível cometer o erro de pensar que o país é dividido entre norte/nordeste e sul/centro-oeste, com raras exceções. 

Agora, vejamos a análise de resultados apresentada pelo Estadão (todas as figuras abaixo foram retiradas de lá). Você pode até dizer que é um jornal pró-direita ou pró-esquerda, francamente, isso não importa aqui.

O mesmo gráfico, mas discretizado por municípios. Essa escalara de duas cores por candidato, diz o seguinte: a cor mais clara é para quem tem menos de 65 % dos votos, a cor mais escura é para quem tem mais de 65 % dos votos. A região em vermelho teve vitória da Dilma, e a região em Azul teve vitória do Serra. 

Bem, a natureza do gráfico permite dizer que as regiões onde a Dilma ganhou com mais de 65 % dos votos é maior (em área) que a região onde o Serra ganhou com mais de 65 % dos votos. Também é possível perceber que a região onde a cor mais clara prevalece é maior que a região onde a cor mais escura prevalece, seja cor azul ou vermelho. A região mais clara das duas cores representa vitórias com menos de 65 % dos votos válidos, ou seja, o candidato vitorioso teve de 50 a 65 % dos votos naquela região, de onde deduz-se que o outro candidato teve de 35 a 50 % do votos válidos (no dois caso, temos um intervalo aberto, do contrário, não tem sentido o que eu escrevi envolvendo o 50 %).


Olhando com mais detalhes, no mesmo local que retirei a figura anterior, observa-se outro tipo de gráfico, apresentando apenas os resultados de um ou outro candidato. 

Nesse esquema, percebe-se aquilo que foi visto no gráfico anterior, mas também percebe-se que na maior parte do país, o candidato vitorioso na região teve entre 25 % e 65 %. Isso permite observar que a força do Serra nas regiões Sul/Centro-Oeste. A análise microscópica dessas regiões revela certo equilíbrio entre as duas forças, portanto, a suposta divisão do primeiro gráfico apresentado não é verdadeira. Também permite observar que em muitos lugares onde a Dilma ganhou com mais de 65 % dos votos, o Serra não teve nem mesmo 25 % dos votos. E dos lugares onde o Serra ganhou com mais 65 % dos votos, na maioria dos casos, a Dilma teve entre 25 e 35 % dos votos. Apenas três pontos isolados do país produziram menos de 25 % dos votos para a Dilma.


 Por fim, não devemos esquecer de olhar a abstenção. Isso é importante porque pode justificar ou não a derrota e vitória de um certo candidato em uma certa região. Como o gráfico baixo não possui um perfil similar a nenhum dos dois gráficos acima, permite-se concluir superficialmente que a taxa de abstenção não prejudicou a representatividade do país.  


Dito isso, concluí-se de forma simples, que não devemos realizar observações locais a partir de dados globais e que não se deve deixar de ler o que cada coisa que está no gráfico representa. Também espero ter demonstrado como a estatística é uma arma, porque mesmo aquilo que escrevi aqui é passível de novas interpretações utilizando dados mais detalhados para construir novos tipos de gráficos.

Para que ninguém diga que eu cometi injustiças, nos dois casos referenciados é possível acessar claramente e facilmente o valor numérico dos dados. De forma que aqui julgo apenas a forma visual do gráfico que pode produzir análises tendenciosas para quem não olhar os números, nada mais, nada menos.

Acrescento também que o G1  fornece o gráfico em barras que apresenta o resultado de forma muito mais clara que o gráfico utilizando o país, como pode ser visto abaixo. É também fato que esse tipo de gráfico é preferível do que qualquer outro apresentado acima. Pois não permite dúvidas. Seu único "problema" é não ter impacto visual.

[update 01/11/2010]
E para concluir o assunto, o G1 disponibilizou uma análise fria dos dados por região, apontando que a Dilma teria ganho a eleição, mesmo desconsiderando os dados das regiões norte e nordeste. Seria uma vitória por apenas 257 mil votos, pouco mais de 0,38 % dos votos válidos da região. Isso mostra como o primeiro gráfico ilude. A vitória de Serra nas regiões centro-oeste e sul foi apertada e no sudeste ele perdeu (apesar de ter ganho em São Paulo).

[/update 01/11/2010]

5 comments:

  1. Nada como um olhar de cientista sobre os fatos :-)

    PS: Viu como o segundo turno não trouxe nenhuma discussão esclarecedora sobre os dois projetos!

    Foi só mais gasto de campanha e tensão nervosa na militância :-)

    ReplyDelete
  2. Isso não quer dizer que o modelo de dois turnos seja ruim, quer dizer apenas que o país tem muito para mudar ainda.

    ReplyDelete
  3. O mais irônico é que Dilma teria ganho, mesmo desconsiderando os dados da região Nordeste.

    Ou seja, em uma vergonhosa demonstração de preconceito, alguns ignorantes estão atribuindo aos outros, no caso os nordestinos, um resultado que também foi feito por eles.

    ReplyDelete
  4. Apesar do comentário acima, no meu ponto de vista é claro que a eleição de Dilma foi fruto das classes menos favorecidas, com menor discernimento para analisar os absurdos que aconteceram nesses 8 anos de governo do PT.

    Caro colega blogueiro, tomei a liberdade de utilizar uma das imagens em meu Blog, dando o devido crédito ao seu. Minhas opiniões estão mais detalhadas em meu Blog: http://protheuzz.wordpress.com/

    ReplyDelete
  5. protheuzz
    francamente, politicamente foi uma eleição complicada, como é normalmente em um país como o Brasil, que precisa crescer muito a nível político e social.

    As pessoas olham para elas mesmas e perguntam: "quem é melhor para mim ?". Responde-se essa pergunta com intento quase sempre individualista e eu pergunto: pode-se culpá-las ? Eu não me atrevo a fazer isso. Digo isso porque acredito que a opinião individualista da maioria é, normalmente, o melhor para todos no momento que a opinião foi tomada. Seja para o bem ou não, pois as pessoas recebem aquilo que estão aptas a compreender e que efetivamente desejaram. De um jeito ou de outro, é sempre a melhor escolha possível.

    Sobre sua opinião, acrescento apenas que sua observação somente se sustenta por existir um grande número de pessoas em classes menos favorecidas e, portanto, por existir um desvio social de longa data não tratado. Os que hoje sentiram-se melhor amparados, assim sentiram por ter tido mais atenção do governo do que em outras épocas.

    Um abraço.

    ReplyDelete