De Gallup até os dias de hoje pouca coisa mudou
Desde que George Gallup fundou o Instituto Americano de Opinião Pública que viria a prever corretamente a vitória de Roosevelt sobre Landon na eleição americana de 1936, utilizando uma amostra de apenas 3.000 respondentes, o uso de métodos de amostragem tornou-se o principal instrumento usado para quantificar opiniões e preferências dos eleitores em todo o mundo.
Fato intrigante é que, desde então, os métodos utilizados para selecionar e entrevistar os eleitores não sofreram mudanças significativas. A entrevista pessoal – seja ela presencial ou por telefone – continua sendo o meio utilizado pelas principais consultorias e institutos de opinião ainda hoje.
Nestas eleições, até o momento, as pesquisas presenciais – em domicílios ou em pontos de fluxo – são a modalidade predominante: 116 de 209 (ou 56%) dos levantamentos sobre a sucessão presidencial com registro no Tribunal Superior Eleitoral (TSE). Na segunda posição vêm as pesquisas telefônicas: 43% do total. Já as pesquisas online, realizadas pela internet nos formatos transversais e painel, correspondem apenas a 1% das pesquisas realizadas.
Mas qual é a importância do modo de pesquisa? Será que o método utilizado para entrar em contato com os eleitores pode afetar os resultados da pesquisa? O método de contato com os eleitores – presencial, telefone, web, mensagens de texto, correio etc. – é chamado de modo de pesquisa. Diferentes modos podem levar a resultados diferentes. Principalmente devido à amostragem: quem é, e quem não é contatado pelas pesquisas, mas também porque diferentes tipos de interações podem influenciar distintamente os entrevistados.
Modos de pesquisa: presencial, telefônica e online
Existem pelo menos quatro modalidades de pesquisas eleitorais quantitativas sendo utilizadas no Brasil. A primeira, e a mais antiga de todas, é a presencial ou face a face. Em uma pesquisa presencial, uma entrevistadora ou entrevistador está fisicamente presente fazendo as perguntas e registrando as respostas do participante.
A modalidade de pesquisa presencial pode oferecer algumas vantagens sobre as pesquisas por telefone e online em termos de complexidade e qualidade dos dados coletados. Entretanto, com essas vantagens vêm também um aumento dos custos por eleitor entrevistado, limitações de cobertura geográfica e fontes potenciais de viés de respostas por influência dos entrevistadores.
A segunda modalidade faz uso de telefones para selecionar e contatar os participantes. Com isso, os custos de logística e de influência do entrevistador sobre quem ele seleciona ou não para participar da sondagem diminuem potencialmente. As técnicas mais comuns empregadas nessa modalidade são conhecidas como CATI (Computer Assisted Telephone Interviewing ou Entrevista Telefônica Assistida por Computador) e CAPI (Computer Assisted Personal Interviewing ou Entrevista Pessoal Assistida por Computador).
A possibilidade de discagem digital aleatória (RDD), boa cobertura geográfica, interação pessoal com menor custo em relação às pesquisas face a face são as principais vantagens das pesquisas telefônicas individuais com entrevistadores. Já entre as principais desvantagens estão a menor taxa de respostas ou de participação e a impossibilidade de usar recursos visuais, como discos com os nomes ou imagens dos candidatos para auxiliar os eleitores. Vale destacar que no Brasil muitas empresas não usam RDD, mas sim amostras retiradas a partir de listagens de números telefônicos obtidas de outros cadastros.
A terceira modalidade também usa telefones para contatar os eleitores, mas sem a interação pessoal com um entrevistador. Conhecida como IVR (Interactive Voice Response ou Unidade de Resposta Audível), essa modalidade emprega uma voz gravada no lugar de um entrevistador ao vivo para fazer perguntas aos entrevistados. Por sua vez, os participantes respondem pressionando uma tecla, falando o número que corresponde à sua resposta ou simplesmente verbalizando sua resposta.
Além do custo menor de execução, a ausência de um entrevistador pode oferecer duas vantagens em relação a uma pesquisa conduzida por um entrevistador ao vivo. Como a voz que lê todas as perguntas é exatamente a mesma, as entrevistas por IVR têm um grau mais alto de padronização do que as entrevistas conduzidas por entrevistadores. Além disso, os participantes podem se sentir mais à vontade para responder sinceramente perguntas mais sensíveis, uma vez que suas respostas são registradas de maneira eletrônica, sem necessidade de responder a uma pessoa desconhecida.
A principal desvantagem do IVR é conseguir selecionar um participante apto, dentro do domicílio discado, sem a ajuda de um entrevistador presente. Outro problema é a baixa taxa de respostas que estas pesquisas alcançam. Por exemplo, uma pesquisa CATI faz cerca de 500 mil ligações telefônicas para conseguir 2.000 entrevistas válidas. Já uma pesquisa por IVR precisa realizar três ou quatro vezes mais tentativas de ligações para obter o mesmo número de entrevistas.
A quarta modalidade de pesquisa, e também a mais recente em uso nas eleições brasileiras, surgiu com a popularização da internet no país. As pesquisas pela internet, assim como por IVR, são autoadministradas. Ou seja, não são conduzidas por nenhum entrevistador, é o próprio participante quem lê, interpreta e registra as informações.
Como toda pesquisa que exige iniciativa dos respondentes, a pesquisa online potencialmente sofrerá do problema de amostras seletivas e do viés de não resposta. Por outro lado, as pesquisas online podem ter custos menores e maior rapidez de execução, são mais visuais, interativas e flexíveis. Isso permite que até mesmo pessoas ocupadas, muitas vezes de maior nível educacional e de maior renda e que sistematicamente ignoram a participação em pesquisas presenciais ou telefônicas, respondam perguntas postadas em suas telas do telefone ou computador.
Brasil x Estados Unidos
Uma rápida comparação com os Estados Unidos, onde as pesquisas online são amplamente utilizadas, permite ter uma ideia do potencial dessa modalidade nas eleições brasileiras.
Considerando apenas as pesquisas eleitorais realizadas para a eleição presidencial entre 2012 e 2020, a modalidade online saltou de 5% para 32% do total. Mas se incluirmos também as pesquisas chamadas multimétodos, ou seja, combinações entre internet e outros modos, como IVR, SMS e telefone, essa taxa passa de 42% para 74%, respectivamente.
As pesquisas que usam IVR – mesma modalidade usada por algumas empresas no Brasil, como o PoderData (Poder360) – são proibidas em alguns estados americanos, mas é permitida quando realizada em conjunto com outra modalidade, como pesquisas pela internet.
Existe algum viés do modo de pesquisa?
Existe! Mas antes de qualquer coisa é importante deixar claro que o viés, ou seja, a tendência de cada modo de pesquisa de favorecer uma ou outra candidatura, não tem relação com a expressão “viés político” ou “ideológico”. Trata-se de um viés estatístico não nulo; portanto, observável e quantificável em termos numéricos.
As imagens a seguir retratam as intenções de votos em Lula e em Bolsonaro, medidas nas sondagens eleitorais realizadas entre março de 2021 e junho de 2022. Cada ponto representa o resultado divulgado pelo instituto; quando mais de um cenário foi testado pela pesquisa, calculei a média entre os cenários. Por sua vez, as linhas projetam a respectiva tendência linear ao longo dos meses para cada modo de pesquisa, identificado nas imagens com a mesma cor dos pontos.
Dois padrões são visíveis a partir da observação dessas imagens:
- Existe maior diferença (variância) entre os levantamentos realizados há 500 ou 400 dias antes da eleição do que agora (100 dias). Isso sugere que independentemente do modo da pesquisa – presencial, telefônica ou internet – as estimativas tendem a convergir à medida que o dia da eleição se aproxima.
- Enquanto a pesquisa realizada de forma presencial apresenta uma tendência a superestimar a intenção de votos para Lula e subestimar os votos para Bolsonaro, as pesquisas telefônicas e via internet fazem o oposto: superestimam votos para Bolsonaro e subestimam para Lula.
As pesquisas eleitorais são gênero de primeira necessidade das eleições. Elas ajudam os candidatos a entender o que a população quer, e os eleitores a entender quem provavelmente terá mais votos nas urnas. Mas as pesquisas também têm limitações importantes que precisam ser consideradas ao analisar os resultados de cada pesquisa individualmente.
A conclusão mais simples desse exercício é que todas as pesquisas terminarão mais ou menos no mesmo lugar, com alguma pequena diferença da média do mercado por causa dos diferentes métodos utilizados para entrar em contato com os eleitores utilizados nestes levantamentos, e também devido aos “house effects”: a tendência da casa em favorecer uma ou outra candidatura em suas sondagens devido às decisões metodológicas tomadas em relação ao eleitorado.
Essa conclusão é mais evidente quando olhamos para a vantagem projetada em cada sondagem. Ou seja, a margem de vitória (ou derrota) do primeiro para o segundo colocado nas pesquisas, uma espécie de “spread eleitoral” que é representado na próxima figura. Neste caso, um valor positivo indica vantagem de Lula; valores negativos apontam vantagem de Bolsonaro.
No ano anterior, a vantagem projetada nas sondagens via internet era muito diferente da vantagem obtida nas pesquisas presenciais, com as pesquisas telefônicas ficando majoritariamente entre essas duas modalidades. Contudo, a distância projetada vem diminuindo gradativamente, considerando cada modo de pesquisa individualmente, mas também o conjunto destes. Fato curioso é que não apenas as pesquisas via internet e telefônicas estão projetando margens positivas maiores (na média), mas também as pesquisas presenciais estão aferindo margens mais modestas.
Na próxima semana, irei apresentar neste espaço algumas ideias sobre o voto confessional, puxando pelo segmento evangélico, e explicarei por que considero que o seu peso nestas eleições tem sido amplamente superestimado por alguns analistas. Até lá!