Como analisar dados de pesquisa

Você coletou os resultados da sua pesquisa e gerou um plano de análise. Agora, chegou o momento de explorar, classificar e analisar os dados.

Como fazer análise de dados de pesquisa simplificada

Os resultados dos seus questionários online chegaram. Agora que você coletou os resultados estatísticos da pesquisa e tem um plano de análise de dados, chegou a hora de começar a calcular os resultados. Veja como nossos cientistas de pesquisas fazem uma análise de dados quantitativos (em comparação com dados qualitativos). Para isso, eles analisam as respostas com foco nas principais perguntas e nas metas da pesquisa, realizam cálculos e tiram conclusões.

Veja como a SurveyMonkey facilita a análise dos resultados

Tudo pronto para começar?

Para começar a calcular os resultados da pesquisa com mais eficácia, siga estas quatro etapas:

  1. Leia atentamente as principais perguntas da pesquisa
  2. Faça uma tabulação cruzada e filtre os resultados
  3. Faça os cálculos numéricos
  4. Tire conclusões

Leia atentamente as principais perguntas da pesquisa

Primeiro, veremos como calcular os resultados da pesquisa a partir das suas principais perguntas. Você tinha perguntas empíricas de pesquisa? Você considerou o uso de amostragem de probabilidade? Lembre-se de que você define quais são as perguntas mais importantes ao criar as metas da sua pesquisa.

Por exemplo, se você realizou um congresso de educação e entregou uma pesquisa de feedback pós-evento a participantes, uma das principais perguntas da pesquisa pode ser: como participantes avaliaram o congresso como um todo? Agora, analise as respostas coletadas em uma pergunta específica da pesquisa relacionada a essa pergunta principal:

Você pretende participar do congresso no ano que vem?

Opções de resposta
Sim71%852
Não18%216
Não tenho certeza11%132
Total1.200

Nas respostas, você obteve algumas porcentagens (71%, 18%) e alguns números (852, 216).

Os percentuais são simplesmente isto: a porcentagem de pessoas que deram uma resposta específica. Em outras palavras, os percentuais representam a proporção entre o número de pessoas que deram cada resposta e o total de pessoas que responderam à pergunta. Dessa forma, 71% de respondentes da pesquisa (852 de 1.200 respondentes) pretendem voltar no ano que vem.

Essa tabela também mostra que 18% dizem que não pretendem voltar e 11% dizem que não têm certeza.

Como realizar tabulação cruzada e filtrar os resultados

Lembre-se de que, quando você definiu uma meta para sua pesquisa e desenvolveu seu plano de análise, tinha em mente os subgrupos para análise e comparação. É nessa hora que todo o planejamento traz resultados. Por exemplo, você gostaria de comparar como professores, estudantes e administradores responderam à pergunta sobre o congresso do ano que vem. Para entender isso, analise as taxas de resposta por meio da tabulação cruzada, na qual os resultados da pergunta do congresso são exibidos por subgrupo:

SimNãoNão tenho certezaTotal
Professor80%
320
7%
28
13%
52
400
Administrador46%
184
40%
160
14%
56
400
Estudante86%
344
8%
32
6%
24
400
Total de respondentes8522161321.200

Segundo a tabela, a grande maioria dos estudantes (86%) e professores (80%) pretende voltar no ano que vem. Contudo, administradores que participaram do congresso têm uma opinião diferente, já que menos da metade (46%) pretende voltar. Com sorte, outras perguntas ajudarão a entender por que isso acontece e o que pode ser feito para melhorar o congresso para que mais administradores voltem a cada ano.

O uso de filtros é outra ferramenta útil para modelar dados. Filtrar significa alinhar o foco em um subgrupo específico e descartar os demais. Dessa forma, em vez de comparar subgrupos entre si, vemos apenas como um subgrupo respondeu à pergunta. Por exemplo, é possível limitar o foco a apenas mulheres, ou apenas homens, e executar novamente a tabulação cruzada por tipo de participante para comparar administradoras, professoras e alunas. Ao selecionar e analisar os resultados, é importante estar ciente de que sempre que um filtro ou tabulação cruzada é aplicado, o tamanho da amostra diminui. Para que os resultados tenham relevância estatística, pode ser útil usar uma calculadora de tamanho de amostra.

Benchmarking, tendências e dados comparativos

Suponhamos que na pesquisa de feedback do congresso havia a pergunta: "Em geral, qual foi o seu nível de satisfação com o congresso?". Os resultados mostram que 75% dos participantes ficaram satisfeitos com o congresso. Isso parece ótimo. Mas não seria bom ter mais contexto? Algo com o qual comparar isso? Isso é melhor ou pior que o ano passado, por exemplo? Como ficam esses dados em comparação com os de outros congressos?

Vamos supor, por exemplo, que você tenha feito essa pergunta na pesquisa de feedback do congresso do ano passado. Você poderá fazer uma comparação de tendência. Pesquisadores profissionais de opinião conhecem muito bem a utilidade das tendências.

Se a taxa de satisfação do ano passado foi de 60%, houve um aumento de 15 pontos percentuais na satisfação deste ano! O que provocou esse aumento da satisfação? Com sorte, as respostas de outras perguntas da pesquisa darão algumas informações a respeito.

Se você não tiver dados do congresso dos anos anteriores, faça deste ano o primeiro e comece a coletar feedback após cada congresso. Isso se chama benchmarking. Você estabelece uma referência ou um número base e, posteriormente, pode ver se isso mudou e como. É possível comparar não apenas a satisfação de participantes a uma referência, como também outras perguntas. Você também pode monitorar anualmente a opinião de participantes sobre o congresso. Isso se chama análise de dados longitudinais.

É possível até mesmo monitorar dados para diferentes subgrupos. Digamos, por exemplo, que as taxas de satisfação vêm aumentando ano após ano para alunos e professores, mas não para administradores. Pode ser interessante olhar as respostas de administradores a várias perguntas para ver se é possível ter alguma ideia de por que estão menos satisfeitos do que outros participantes.

Como fazer os cálculos numéricos

Você sabe quantas pessoas disseram que voltariam, mas como sabe se pode confiar nas respostas à sua pesquisa e usá-las com segurança para embasar futuras decisões? É importante prestar atenção à qualidade dos seus dados e entender os componentes da relevância estatística.

Na linguagem cotidiana, "relevante" quer dizer importante ou significativo. Em análise de pesquisa e estatística, relevância se refere a uma "avaliação da precisão". É o ponto em que o inevitável "mais ou menos" entra na pesquisa. Isso significa que os resultados da pesquisa são precisos apenas dentro de uma margem de confiança específica, não por aleatoriedade. É arriscado tirar conclusões baseadas em resultados imprecisos (ou seja, sem relevância estatística). O primeiro fator a ser considerado em qualquer avaliação da relevância estatística é a representatividade da amostra, ou seja, até que ponto o grupo de pessoas incluído na pesquisa se assemelha à população total sobre a qual você quer tirar conclusões.

Se 90% dos participantes do congresso que responderam à pesquisa fossem homens, mas apenas 15% de todos os participantes fossem homens, teríamos um problema. Quanto mais se sabe sobre a população sendo estudada, mais confiante você poderá ficar quando os resultados das pesquisas se alinharem a esses números. No exemplo que estamos vendo, se 15% dos respondentes forem homens, isso é bom.

Se a amostra da pesquisa é escolhida aleatoriamente entre uma população conhecida, a relevância estatística pode ser calculada de maneira direta. O principal fator aqui é o tamanho da amostra. Suponhamos que 50 das 1.000 pessoas que participaram do congresso responderam à pesquisa. Cinquenta (50) é uma amostra pequena, e os resultados terão uma grande margem de erro. Em outras palavras, os resultados não terão muita relevância.

Suponhamos que você tenha perguntado a respondentes de quantas das 10 sessões participaram durante o congresso. Seus resultados são:

12345678910TotalMédia de avaliação
Número de participação em sessões10%
100
0%
0
0%
0
5%
50
10%
100
26%
280
24%
240
19%
190
5%
50
1%
10
1.0006,1

Analise a média. Como você deve se lembrar, existem três tipos diferentes de média: a média aritmética, a mediana e a moda.

Na tabela acima, a média de sessões das quais participaram é 6,1. Aqui, na verdade, estamos falando da média mais conhecida por todos. Para determinar a média, basta somar os dados e dividir pelo número de valores contabilizados. Neste exemplo, 100 pessoas afirmam ter participado de uma sessão, 50 pessoas participaram de quatro sessões, 100 pessoas de cinco sessões etc. Portanto, você multiplica cada um desses pares, soma os resultados e divide essa soma pelo número total de pessoas.

A mediana é outro tipo de média. Trata-se do valor do meio exato, ou seja, a marca dos 50%. Na tabela acima, ela é o número de sessões a partir do qual existem 500 pessoas à esquerda e 500 à direita. A mediana é, neste caso, sete sessões. Isso ajuda a descartar a influência de valores discrepantes que possam afetar os dados negativamente.

O último tipo de média é a moda. A moda é a resposta mais frequente. Neste caso, a resposta é seis. Duzentos e sessenta (260) respondentes da pesquisa participaram de seis sessões, valor mais citado do que qualquer outro número de sessões.

As médias em geral (incluindo a mediana e a moda) também podem ser usadas se os seus resultados se baseiam na escala Likert.

Como tirar conclusões

Na hora de criar um relatório com os resultados da pesquisa, pense na história contada pelos dados.

Vamos supor que o congresso em geral recebeu avaliações medíocres. Você explora a pergunta para saber o que está acontecendo. Os dados mostram que participantes tiveram excelentes opiniões sobre quase todos os aspectos do congresso (as sessões e aulas, os eventos sociais e o hotel), mas não gostaram da cidade escolhida para o evento. Suponhamos que o congresso tenha sido realizado em Foz do Iguaçu em julho e fazia muito frio para sair à rua. Essa é uma parte importante da história: ótimo congresso em geral, mas péssima escolha da localização. Fortaleza ou Salvador poderia ter sido uma escolha melhor para um congresso no inverno.

Um aspecto da análise e interpretação de dados e da geração de relatórios que deve ser considerado é a causalidade em contraste com a correlação.

Analise sua próxima pesquisa com a SurveyMonkey

Anexo

O que é coleta de dados de pesquisa?

A coleta de dados de pesquisas usa perguntas para obter informações de respondentes específicos. Ela pode substituir ou complementar outros tipos de coleta de dados, como entrevistas e grupos focais. Os dados coletados a partir de pesquisas podem ser usados para impulsionar o envolvimento do funcionário, entender o comportamento do comprador e melhorar a experiência do cliente.

O que é análise longitudinal?

Na análise de dados longitudinais (também chamada "análise de tendências"), basicamente se monitora como os resultados de perguntas específicas mudam ao longo do tempo. Quando se estabelece uma referência, é possível determinar como e se os números mudam. Suponhamos que a taxa de satisfação da conferência foi de 50% três anos atrás, 55% dois anos atrás, 65% ano passado e 75% este ano. Parabéns pelo trabalho! A análise dos dados longitudinais mostra um aumento constante da satisfação e com tendência ascendente.

Qual é a diferença entre correlação e causalidade?

Causalidade é quando um fator causa outro. Correlação é quando duas variáveis mudam paralelamente, mas uma não influencia ou causa a outra. Por exemplo, beber chocolate quente e usar luvas são duas variáveis correlacionadas, pois tendem a variar juntas e no mesmo sentido. Porém, uma não causa a outra. Na verdade, as duas são provocadas por um terceiro fator, o frio. O frio influencia tanto o consumo de chocolate quente quanto a probabilidade de usar luvas. Ele é uma variável independente, e o consumo de chocolate quente e a probabilidade de usar luvas são variáveis dependentes. No caso da pesquisa de feedback do congresso, o frio é a provável causa da insatisfação de participantes com a cidade do evento e com o congresso em geral. Por fim, para examinar ainda mais a relação entre variáveis na pesquisa, pode ser necessário fazer uma análise de regressão.

O que é análise de regressão?

A análise de regressão é um método avançado de análise e visualização de dados que permite observar a relação entre duas ou mais variáveis. Existem muitos tipos de análise de regressão. A escolha de um ou outro dependerá das variáveis sendo examinadas. O que todos os tipos de análise de regressão têm em comum é a observação da influência de uma ou mais variáveis independentes em uma variável dependente. Ao analisar os dados da nossa pesquisa, podemos querer saber quais fatores mais afetam a satisfação de participantes com o congresso. Trata-se do número de sessões? De palestrantes convidados para a abertura? Dos eventos sociais? Do local? Com uma análise de regressão, cientistas de pesquisas podem determinar se a satisfação com esses atributos do congresso contribui para a satisfação geral e em que medida.

Por sua vez, isso proporciona insights sobre quais aspectos do congresso podem ser ajustados da próxima vez. Suponhamos, por exemplo, que você pagou um preço altíssimo por um palestrante importante para a sessão de abertura. Os participantes deram notas altas a esse palestrante e ao congresso em geral. Com base nesses dois fatores, poderíamos pensar que ter um palestrante espetacular (e caro) é o segredo do sucesso do congresso. A análise de regressão ajuda a determinar se esse é, de fato, o caso. Você pode considerar que a popularidade do palestrante foi o principal motivo da satisfação com o congresso. Se esse for o caso, no ano que vem, você vai querer um palestrante de alto nível novamente. No entanto, suponhamos que a regressão mostre que, embora todos tenham gostado do palestrante, ele não contribuiu muito para a satisfação com o congresso. Se esse for o caso, talvez seja melhor usar o dinheiro que seria investido com o palestrante em outro aspecto. Se você analisar atentamente os dados da pesquisa, as respostas podem ser usadas para tomar decisões bem fundamentadas.