O Estado de São Paulo : 16.04.2018
Neném Prancha dizia que se concentração ganhasse jogo o time da penitenciária não perderia uma partida. O antigo técnico do Botafogo preteria o rigor científico em favor da verve, razão pela qual ele é aqui lembrado décadas depois de sua morte. Um economista chato, com perdão da redundância, talvez fosse mais cauteloso nesta afirmação e desenvolveria um modelo econométrico para calcular a efetiva contribuição das concentrações na explicação das vitórias dos times. Seria algo mais rigoroso – mas não seria lembrado por ninguém.
Ainda assim, um certo cuidado metodológico no tratamento das estatísticas pode ser de grande utilidade neste ano eleitoral. Nas próximas semanas seremos bombardeados por pesquisas cuja leitura exige cautela. As pesquisas erram, sabemos todos. A tentação mais infantil é acreditar que os institutos são comprados para produzir resultados que satisfaçam interesses. Assim como no caso das salsichas de Bismarck, nós não sabemos como são elaboradas estas pesquisas, asseguram os teóricos da conspiração. Não é por aí. Mais crível é considerar que os institutos vivem de seus produtos – que vão muito além de sondagens eleitorais – e que sem credibilidade o negócio deles não sobreviveria, até porque não compramos margarina apenas a cada quatro anos.
Há dois equívocos encontradiços que derivam da interpretação errônea destas pesquisas. O primeiro é assumir que o erro se distribui homogeneamente em torno do percentual indicado. Não é verdade. Se um candidato tem, digamos, 15% das preferências e a margem de erro divulgado é de dois pontos percentuais, é muito mais provável que o verdadeiro valor – se toda a população fosse pesquisada naquele momento – esteja em 15,1% ou 14,9% do que em 16,9% ou 13,1%. Um corolário desta constatação é que um candidato que tem, ainda assumindo uma margem de 2 pontos, 14% não está, ao contrário do que se ouve, em “empate técnico” com outro que apresente 17% das preferências. A probabilidade do primeiro candidato ter a mesma preferência que o segundo neste exemplo é residual. O segundo equívoco, mais grave, é o próprio conceito de margem de erro. Pesquisas amplas são caras e exigem tempo. A nova Pesquisa de Orçamento Familiares do IBGE começou em junho de 2017 e só ficará pronta em meados deste ano. Mais de mil agentes visitarão 75 mil domicílios em 1900 municípios para saber como o brasileiro gasta seu dinheiro. Uma pesquisa eleitoral é feita de forma muito menos elaborada, por razões práticas. Isto exige que as amostras sejam feitas não de forma aleatória, mas através da seleção de estratos da população que, espera-se, possam replicar a complexidade do todo. O problema é que não é recomendável o uso de intervalos de confiança nos casos desta técnica amostral. Amostras não probabilísticas são muito mais baratas e rápidas, mas não são compatíveis com o uso de intervalos de confiança. Em novembro do ano passado, no rastro das investigações sobre as pesquisas que erraram o resultado do plebiscito do Brexit, o governo britânico adotou a orientação (“ GSR Quota Sampling Guidance”, disponível na rede) de que a divulgação de intervalos de confiança deve ser evitada no caso de pesquisas baseadas em amostras por estratos – ou acompanhada da explicação de que a verdadeira margem de erro é desconhecida. Aqui, ao contrário, a legislação exige a divulgação da margem de erro, o que faz pouco sentido do ponto de vista estatístico. Há várias formas de errar no processo eleitoral e a escolha de um candidato despreparado é a mais óbvia delas.
Mas falar de margem de erro é um erro que pode ser evitado.
Economista. Foi diretor de política monetária do Banco Central e professor da PUC-SP e FGV-SP. Email: luiseduardoassis@gmail.com