Pages

Sunday, October 31, 2010

Interpretação estatística de resultados

Há poucas coisas tão importantes na ciência quanto a arte de interpretar resultados. Tomemos, por exemplo, as eleições de segundo turno para presidente realizada no dia 31 de outubro de 2010.

Um mapa comum apresentado por várias fontes, como na cobertura do G1, é apresentado abaixo.
Se ainda não percebeu, esse gráfico possui uma péssima representação visual. Ele fornece um panorama de vitória pelo estado e utiliza uma escala de cores inadequada para os valores apresentados.

Resumindo, olhando para esse gráfico, é possível cometer o erro de pensar que o país é dividido entre norte/nordeste e sul/centro-oeste, com raras exceções. 

Agora, vejamos a análise de resultados apresentada pelo Estadão (todas as figuras abaixo foram retiradas de lá). Você pode até dizer que é um jornal pró-direita ou pró-esquerda, francamente, isso não importa aqui.

O mesmo gráfico, mas discretizado por municípios. Essa escalara de duas cores por candidato, diz o seguinte: a cor mais clara é para quem tem menos de 65 % dos votos, a cor mais escura é para quem tem mais de 65 % dos votos. A região em vermelho teve vitória da Dilma, e a região em Azul teve vitória do Serra. 

Bem, a natureza do gráfico permite dizer que as regiões onde a Dilma ganhou com mais de 65 % dos votos é maior (em área) que a região onde o Serra ganhou com mais de 65 % dos votos. Também é possível perceber que a região onde a cor mais clara prevalece é maior que a região onde a cor mais escura prevalece, seja cor azul ou vermelho. A região mais clara das duas cores representa vitórias com menos de 65 % dos votos válidos, ou seja, o candidato vitorioso teve de 50 a 65 % dos votos naquela região, de onde deduz-se que o outro candidato teve de 35 a 50 % do votos válidos (no dois caso, temos um intervalo aberto, do contrário, não tem sentido o que eu escrevi envolvendo o 50 %).


Olhando com mais detalhes, no mesmo local que retirei a figura anterior, observa-se outro tipo de gráfico, apresentando apenas os resultados de um ou outro candidato. 

Nesse esquema, percebe-se aquilo que foi visto no gráfico anterior, mas também percebe-se que na maior parte do país, o candidato vitorioso na região teve entre 25 % e 65 %. Isso permite observar que a força do Serra nas regiões Sul/Centro-Oeste. A análise microscópica dessas regiões revela certo equilíbrio entre as duas forças, portanto, a suposta divisão do primeiro gráfico apresentado não é verdadeira. Também permite observar que em muitos lugares onde a Dilma ganhou com mais de 65 % dos votos, o Serra não teve nem mesmo 25 % dos votos. E dos lugares onde o Serra ganhou com mais 65 % dos votos, na maioria dos casos, a Dilma teve entre 25 e 35 % dos votos. Apenas três pontos isolados do país produziram menos de 25 % dos votos para a Dilma.


 Por fim, não devemos esquecer de olhar a abstenção. Isso é importante porque pode justificar ou não a derrota e vitória de um certo candidato em uma certa região. Como o gráfico baixo não possui um perfil similar a nenhum dos dois gráficos acima, permite-se concluir superficialmente que a taxa de abstenção não prejudicou a representatividade do país.  


Dito isso, concluí-se de forma simples, que não devemos realizar observações locais a partir de dados globais e que não se deve deixar de ler o que cada coisa que está no gráfico representa. Também espero ter demonstrado como a estatística é uma arma, porque mesmo aquilo que escrevi aqui é passível de novas interpretações utilizando dados mais detalhados para construir novos tipos de gráficos.

Para que ninguém diga que eu cometi injustiças, nos dois casos referenciados é possível acessar claramente e facilmente o valor numérico dos dados. De forma que aqui julgo apenas a forma visual do gráfico que pode produzir análises tendenciosas para quem não olhar os números, nada mais, nada menos.

Acrescento também que o G1  fornece o gráfico em barras que apresenta o resultado de forma muito mais clara que o gráfico utilizando o país, como pode ser visto abaixo. É também fato que esse tipo de gráfico é preferível do que qualquer outro apresentado acima. Pois não permite dúvidas. Seu único "problema" é não ter impacto visual.

[update 01/11/2010]
E para concluir o assunto, o G1 disponibilizou uma análise fria dos dados por região, apontando que a Dilma teria ganho a eleição, mesmo desconsiderando os dados das regiões norte e nordeste. Seria uma vitória por apenas 257 mil votos, pouco mais de 0,38 % dos votos válidos da região. Isso mostra como o primeiro gráfico ilude. A vitória de Serra nas regiões centro-oeste e sul foi apertada e no sudeste ele perdeu (apesar de ter ganho em São Paulo).

[/update 01/11/2010]

Monday, October 25, 2010

Extensões para Firefox ou Chromium: versão definitiva

Existe uma primeira, segunda e terceira versão da minha lista de extensões para o Firefox. Agora eu não uso mais o Firefox e me cansei de gerar essas listas para o blog.

Assim, divulgo a minha lista de extensões para o Chromium/Google Chrome e a última lista de extensões para o Firefox. Tenho usado o Chromium  para tarefas do dia-a-dia reservando o Firefox para tarefas críticas, como acessar bancos, comprar pela internet, etc.

Acesse a última versão da lista de extensões para o Firefox.
Acesse a versão definitiva da lista de extensões para o Chomium/Google Chrome.

A versão definitiva é assim chamada porque na tag em questão você encontra apenas as extensões que eu estou utilizando atualmente no meu Chromium. Esse conteúdo será alterado conforme eu adicione ou remova extensões. Algo bem simples. A última versão da lista de extensões para o Firefox é a "última" porque passei a utilizar o Chromium (trivial, não ?).

Um link para a lista de extensões do Chromium será colocado na barra lateral desse blog para facilitar o acesso. Para os leitores, que como eu, utilizam alguma técnica para controlar a freqüência que devem ser lembrados de visitar uma certa página e tenha interesse de monitorar esse link, eu recomendaria visitas anuais. Embora a lista possa ser alterada semanalmente, dependendo do meu humor, a visita anual impede o stress desnecessário com esse assunto.

Esse tópico não irá impedir que eu comente sobre extensões do Firefox ou do Chromium se considerar que isso seja interessante.

Friday, October 08, 2010

5 anos

Cinco anos se passaram desde que publiquei a primeira mensagem nesse blog. Eu somente realizei quanto o blog cresceu desde essa mensagem quando escrevi sobre o aniversário de 3 anos.

Só posso dizer: Obrigado a todos.