Search
  • ipespe

Sobre a diferença de número nas pesquisas

Por Antonio Lavareda*


Muitas pessoas me perguntaram a respeito após a divulgação, esta semana, dos números do Datafolha sobre a eleição presidencial de 2022. Segundo os quais, calculando-se os votos válidos, Lula teria, no segundo turno, 63% contra 37% de Bolsonaro.

Resumo aqui o que tenho respondido a elas, tentando esclarecer cinco fatores básicos que teoricamente seriam capazes de explicar as diferenças, por exemplo, entre a pesquisa referida e a última XP/IPESPE. No Datafolha, sobre os totais, Lula apareceu com 41% na estimulada do primeiro turno e 55% no segundo, ao passo que na XP/IPESPE os números foram respectivamente 29% e 42%. Bolsonaro, por sua vez obteve no DataFolha 23% e 32%, enquanto na XP/IPESPE registrou 29% e 40%.

1. O momento da realização. O levantamento XP/IPESPE foi realizado entre os dias 04 e 07 de maio, enquanto o DataFolha nos dias 12 e 13. Na média uma distância de sete dias. Suficiente para explicar flutuações, mas que não justificaria as diferenças encontradas nas intenções de voto estimuladas dos dois principais candidatos.


2. O tamanho das amostras. De fato, a amostra do DataFolha (2.071) é o dobro da amostra XP/IPESPE (1.000) mas isso também não explica a magnitude das diferenças apontadas, porque as margens de erro máximo não são tão distantes - a do DataFolha sendo de 2 pontos percentuais para mais ou para menos e a da XP/IPESPE de 3,2 pontos.


3. O método adotado. O DataFolha realizou entrevistas presenciais; as da XP/IPESPE foram telefônicas com telepesquisadores(as). Embora haja alguns que ainda supõem que o método presencial seria mais “preciso” isso não procede. Nos EUA e na Europa há cerca de uma década não se faz pesquisas eleitorais presenciais. No Brasil 98,5% da população tem acesso à telefonia celular. E mais ainda, na conjuntura da pandemia, onde se recomenda distanciamento social, é plausível que muito mais pessoas temam ser abordadas nas ruas por estranhos com máscaras e permanecer algum tempo interagindo a menos de um metro, convidadas a apontar nomes de candidatos no cartão apresentado no tablet do entrevistador, do que respondendo a uma pesquisa telefônica. Em levantamento que o IPESPE realizou em setembro passado na cidade de São Paulo 66% responderam que se sentiam mais seguros respondendo a entrevistas por telefone, enquanto apenas 5% disseram que preferiam ser abordadas presencialmente na rua ou em casa, e 27% que tanto fazia uma coisa ou outra. Uma taxa mais elevada de recusas, que já é alta em todas as pesquisas, pode sim comprometer a amostra e distorcer a representatividade dos resultados. Por motivos lógicos o próprio DataFolha deixou de realizar pesquisas presenciais nesse último ano. E eu desconheço o que poderia ter justificado mudar esse procedimento agora.


4. Efeito questionário. A ordem e a formulação das questões têm grande capacidade de influenciar as respostas obtidas. No que toca ao primeiro aspecto na pesquisa XP/IPESPE a intenção de voto presidencial é a primeira pergunta do questionário. Pela óbvia relevância do tema ela é tratada como “variável dependente” que deve ficar protegida de qualquer contaminação (por “efeito consistência” entre outros) do restante da entrevista. No levantamento do DataFolha não se sabe. No Relatório que o instituto divulgou aparece na capa “Intenção de Voto Presidencial 2022” o que sugere que pode ter sido a primeira indagação, porém lá ao final dele, no rodapé das tabelas está escrito “PO4062 - Opinião sobre o Coronavírus 11”. A décima primeira pesquisa sobre o tema. Se esse foi o objetivo principal as questões sobre a pandemia deverão ter vindo à frente no questionário. Se isso ocorreu, podem ter contaminado as intenções de voto presidenciais. No última XP/IPESPE 58% avaliaram como Ruim/Péssima a gestão de Bolsonaro na pandemia e apenas 22% como Ótima/Boa. No passado o DataFolha divulgava todas as questões na ordem de sua formulação. Outro aspecto na formulação das questões de voto diz respeito à cartela utilizada. Os nomes dos candidatos no DataFolha vieram com seus partidos ao lado (LULA, PT) e para os que não os têm surgiu grafado ao lado do seu nome em maiúsculas assim: BOLSONARO, SEM PARTIDO. Isso afeta as respostas estimuladas com a lista? Pode ser. Difícil responder. Mas a formulação é no mínimo inadequada porque a pergunta inclui “se a eleição fosse hoje” e o pertencimento a um partido é requisito obrigatório das candidaturas.


5. Variável de controle. Todas as pesquisas realizadas por todos os institutos brasileiros se valem de “cotas” para assegurar a representação dos principais segmentos socioeconômicos nas amostras - sexo, idade, instrução, renda e mais localização dos municípios, porte e regiões. Alguns é verdade não cumprem todas elas, só as básicas. Mas fica faltando observar o quanto a amostra é representativa das orientações políticas dos entrevistados. Nos EUA e na Europa não se faz pesquisa política sem questões de identificação partidária, orientação ideológica e voto na eleição anterior. Aqui as duas primeiras características não seriam úteis, mas o recall do voto, mesmo com distorções explicadas na literatura, com certeza qualifica, aprimora, a leitura dos resultados. No Relatório da última XP/IPESPE está lá no final: 2o turno de 2018, sobre os totais, Bolsonaro, 46% X Haddad, 33%. Bolsonaro com mais 7 pontos e Haddad com um ponto a mais do que tiveram conforme o TSE. Claro que conhecendo esses números do recall podemos conjecturar melhor sobre a natureza da amostra do ponto de vista do seu comportamento político anterior, melhorando a interpretação dos dados.


Vale observar que houve convergências nas duas pesquisas entre outras coisas nas intenções de voto de Lula na pergunta espontânea (21%) e nos percentuais da questão estimulada dos outros cinco candidatos, além das opções Branco/Nulo/Não sabe, com diferenças dentro da margem de erro ou coincidindo os percentuais. Outra curiosidade é que no quesito Avaliação do Governo Bolsonaro aparece o Ótimo/Bom do DataFolha com 24% e o da XP/IPESPE com 29% (dentro da margem de erro, na avaliação positiva) mas nas respostas Ruim/Péssimo - de onde teoricamente sairia o grosso da intenção de voto em Lula - o percentual na XP/IPESPE é maior (49%) que o do DataFolha (45%), embora também dentro da margem de erro. Ou seja, na XP/IPESPE há até mais eleitores com opinião francamente negativa sobre o Governo do que no DataFolha.


Concluo assinalando que os dados das pesquisas sociais por amostragem embora sejam fruto de uma base científica consolidada estão longe de traduzir, de estimar com absoluta exatidão a distribuição das percepções e opiniões das pessoas, os anseios da sociedade ou suas preferências eleitorais. Isso não se resolve apenas pela consideração das “margens de erro”, polêmicas aliás em amostras por cotas. São aproximações da realidade. Daí a importância de que os que nelas trabalham sempre estejam abertos à discussão dos seus dados e à reflexão sobre suas limitações.


*Cientista político e presidente do Conselho Científico do IPESPE

18 views0 comments