Coleta de dados: separe o material para fazer o bolo

Agora que você selecionou seus ingredientes, vamos escolher os utensílios que vão ajudar a medir, separar e misturá-los. Para isso será necessário utilizar instrumentos para registrar e quantificar as variáveis e, depois, formar o banco de dados.

O que é coleta de dados?

A coleta de dados é o processo de reunir informações relevantes para o seu estudo. Essas informações, ou dados, podem ser coletadas de várias maneiras, incluindo observações, entrevistas, questionários, testes,  medições e bancos de dados já existentes. É importante que a coleta de dados seja planejada e executada de maneira cuidadosa para garantir que as informações coletadas sejam precisas e confiáveis. O ponto de partida para a organização da coleta são os tipos e características de suas variáveis.

Instrumentos de coleta de dados

Independentemente da forma de coleta dos dados, será necessário registrá-los. Geralmente, o registro é feito por meio de questionários, que podem ser físicos e eletrônicos. Eles também podem ser preenchidos pelo sujeito da pesquisa (autopreenchidos) ou pelo pesquisador.

Um questionário é um conjunto de perguntas que visa obter e registrar informações sobre um determinado assunto ou fenômeno. Eles podem ser desenvolvidos pela própria equipe de pesquisa ou pode ser necessário utilizar um questionário já desenvolvido e validado por outros pesquisadores. Isso depende do objetivo do seu projeto.

No caso de medidas de fenômenos observáveis, como peso, altura, resultados de exames, diagnósticos, não há problemas em desenvolver o próprio questionário. Se você fizer parte de um estudo multicêntrico, ou quiser reproduzir um estudo realizado em outro local, deve utilizar o mesmo questionário dos outros centros, para que os dados possam ser comparáveis e criar um único banco de dados, no caso de estudos multicêntricos.

A coisa fica um pouco mais complicada caso você precise medir uma variável ou traço latente (também chamados de constructo), como atitudes, comportamentos, percepções ou sentimentos (por exemplo, depressão, empatia, dependência de smartphones). O traço latente não é diretamente observável, então, para estimá-lo é necessário utilizar um tipo especial de questionário, chamado de escala. A escala é formada por um conjunto de perguntas previamente validadas cujo resultado deve indicar o nível de determinado fenômeno, permitindo a comparação intra e interestudos.

O questionário de determinado projeto pode conter uma parte desenvolvida pelo próprio pesquisador associada a uma ou mais escalas. Sempre que você quiser utilizar um questionário ou escala produzido por outro grupo, é importante solicitar a autorização dos autores e verificar se há direitos autorais. Várias escalas são produtos comerciais e seu uso sem autorização prévia pode gerar problemas.

Os roteiros de entrevistas também podem ser considerados questionários. Eles podem ser estruturados ou semiestruturados. Nos roteiros estruturados, todas as perguntas devem feitas exatamente como estão no questionário. Já os semiestruturados, funcionam como um roteiro e são aceitos novos temas. As respostas podem ser escritas ou gravadas e transcritas posteriormente.

Tipos de perguntas

As perguntas em um questionário podem ser abertas ou fechadas. As perguntas abertas permitem que os participantes ou entrevistadores respondam com suas próprias palavras. Elas também podem ser utilizadas para coletar dados numéricos. Neste caso, é importante definir o número de casas inteiras e/ou decimais e as unidade da medida, para evitar erros de preenchimento. Sempre que trabalhar com variáveis numéricas, colete os números e não categorias. Por exemplo, pergunte a idade e não faixa etária, ou o salário e não a faixa de renda. Depois, você poderá categorizar os dados na análise, mas o inverso não é possível.

As perguntas abertas permitem que os participantes expressem suas opiniões, sentimentos e experiências de forma livre e podem gerar dados qualitativos e exploratórios, revelar aspectos inesperados ou desconhecidos sobre o tema do estudo. Também podem ser utilizadas quando não se conhece todas as opções de respostas possíveis, ou o número de respostas é muito grande, como por exemplo, a profissão das pessoas. Por outro lado, elas podem ser difíceis de analisar e comparar, exigir mais tempo e esforço e produzir respostas vagas, incompletas ou irrelevantes.

As perguntas fechadas fornecem opções de resposta pré-definidas. Elas são fáceis de responder e de codificar, geram dados quantitativos e descritivos. Podem garantir a consistência e a comparabilidade das respostas e reduzir o viés e a ambiguidade. No entanto, podem limitam as opções e as manifestações dos participantes, induzir respostas sociais ou politicamente desejáveis e ignorar aspectos importantes ou complexos do fenômeno estudado.

As perguntas abertas e fechadas têm objetivos diferentes. As perguntas abertas são mais adequadas para explorar a compreensão ampla e profunda de um tema. As perguntas fechadas são melhores para analisar tópicos já conhecidos e medir variáveis.

A escala de Likert é um tipo especial de pergunta fechada, que mede o grau de concordância ou discordância dos participantes com uma determinada afirmação. Normalmente, utiliza-se um número ímpar de opções (geralmente cinco):

Qual é o seu grau de satisfação com o serviço prestado pela empresa?

          1. Muito insatisfeito
          2. Insatisfeito
          3. Nem satisfeito nem insatisfeito
          4. Satisfeito
          5. Muito satisfeito

Ela permite obter informações sobre as atitudes, opiniões, sentimentos ou comportamentos dos participantes em relação a um tema específico. No entanto, a escala de Likert também tem algumas limitações, como a tendência dos participantes a escolherem os pontos centrais da escala, a dificuldade de interpretar o significado dos números e a possibilidade de viés de desejabilidade social (escolher respostas socialmente corretas).

Estrutura do questionário

O questionário deve seguir uma ordem lógica, para facilitar o seu preenchimento. As letras devem ter um tamanho adequado, que facilite a leitura (caso seu público inclua paciente idosos, avalie usar letras maiores). Divida o questionário em blocos ou seções e coloque todas as perguntas pertinentes a cada um deles.

As perguntas devem estar claramente separadas, para não confundir o preenchimento. Para isso, recomenda-se usar uma estrutura tipo tabela, colocando apenas um pergunta por linha da tabela. As alternativas de resposta devem iniciar na linha após a pergunta, alinhadas entre si e recuadas (mais para a direita), facilitando a leitura e a separação visual. Não se esqueça de numerar sequencialmente as perguntas. Alguns pesquisadores recomendam que se deixe uma coluna em branco à direita para a codificação (veja mais detalhes a seguir).

No caso de questionários on-line, é importante conferir a aparência em dispositivos móveis, como tablets e celulares, com a tela na vertical e na horizontal, pois de acordo com o tipo de pergunta, pode ser que não apareçam todas as alternativas de resposta.

Cabeçalho

Deve-se inserir um cabeçalho com o nome do projeto de pesquisa, logomarca da instituição (se for o caso) e o identificador único do voluntário. No caso de questionários físicos, todas as páginas devem ser numeradas e todas as folhas devem conter o cabeçalho na página ímpar. Lembre-se que por questões de sigilo, o questionário não pode conter o nome do voluntário ou suas iniciais.

No caso de estudos prospectivos com várias análises do mesmo voluntário ao longo do tempo, estudos tipo antes e depois ou estudos pareados, é necessário acrescentar um campo separado, além do identificador único, que indique o número da consulta ou os pares.

Identificador único

Você deve garantir que o identificador seja realmente único. A maneira mais fácil de fazer isso é numerar sequencialmente os questionários e os Termos de Consentimento Livre e Esclarecido, que deve ter o mesmo número do questionário. Esta estratégia funciona bem se houver apenas um entrevistador ou se os dados forem coletados juntos, em um mesmo momento.

No entanto, no caso de vários entrevistadores ou de estudos multicêntricos, é importante garantir que o identificador realmente seja único. Neste caso, pode-se utilizar um código composto. Por exemplo, supondo que a amostra será menor do que 1000 voluntários, você pode usar duas casas para identificar o entrevistador ou o centro de pesquisa e três casas para identificar o voluntário. Cada entrevistador ou centro de pesquisa usaria sua sequência a partir de 001. Assim 01001 seria o primeiro voluntário do entrevistador 01 e 03010 seria o décimo voluntário do entrevistador 03. Outra opção seria usar um código para o centro de pesquisa e outro para o entrevistador, seguido do voluntário. Por exemplo, 0201001 (centro de pesquisa 02, entrevistador 01, voluntário 001) e 0103010 (centro de pesquisa 01, entrevistador 03, voluntário 010). Recomenda-se que o código contenha apenas números, para agilizar o processo de digitação, caso ele seja necessário. Você pode usar números e letras, como a primeira letra do primeiro nome do voluntário mais os quatros primeiros números do CPF.

Instruções gerais

Esta seção deve conter uma pequena explanação sobre o objetivo do projeto, o agradecimento pela participação e as instruções sobre o preenchimento. Caso o questionário seja preenchido por um entrevistador, ele deve orientado a transmitir essas informações ao voluntário. Se for um questionário autopreenchido, as informações devem ser direcionadas ao voluntário.

Blocos

Segue uma proposta de divisão dos blocos ou seções do questionário, que podem variar de acordo com a necessidade do projeto. O mais importante é que eles sigam uma ordem lógica, e que todas as perguntas referentes a determinado tema, fiquem no mesmo bloco.

Estrutura do questionário:

      • identificação (sexo, idade, naturalidade, residência, escolaridade, estado civil);
      • hábitos de vida (consumo de tabaco ou álcool, sedentarismo, atividade física);
      • dados vitais (pressão arterial, peso, altura, circunferência abdominal);
      • escalas específicas (qualidade de vida, depressão, empatia, inteligência emocional).

No caso de utilização de escalas específicas, é importante colocar no início da seção as instruções específicas para o preenchimento de cada uma delas.

Codificação das variáveis

A codificação é o processo de transformar dados de uma forma para outra, frequentemente para facilitar a manipulação, o armazenamento ou a análise. No caso dos questionários de pesquisa, você deve definir um número para cada alternativa em cada pergunta. Você pode colocar este número entre parênteses, para ser marcado pelo respondente, ou no início da alternativa.

A forma mais simples é a codificação ordinal, definindo números sequenciais para as alternativas. Alguns cuidados devem ser tomados. Primeiro, não faça perguntas com mais de uma resposta. Se necessário, crie várias perguntas de sim ou não. Veja um exemplo a seguir.

Não use

Você já teve alguma doença sexualmente transmissível?

            (1) Não

            (2) Sífilis

            (3) Cancro mole

            (4) Condiloma

 Use

Você já teve sífilis?

            (0) Não              (1) Sim

Você já teve cancro mole?

            (0) Não              (1) Sim

Você já teve condiloma?

                  (0) Não                     (1) Sim

Use sempre ZERO para não ou para a ausência de uma característica. No caso de variáveis categóricas, use ZERO para a sua alternativa considerada normal. Isso é muito importante para a manipulação de dados e para análise estatística. Considerando a pergunta do exemplo, no formato da segunda coluna, você pode identificar os pacientes que tiveram DSTs somando as respostas isoladas. Todos os pacientes que tiveram a soma igual a zero, nunca tiveram DST. Perguntas que tenham o mesmo conjunto de alternativas devem ter o mesmo número de codificação. Padronize um código para “não se aplica” e outro para “sem informação”. Geralmente, utiliza-se 8 e 9, respectivamente.

Outra dica importante é não faça nenhum cálculo durante o preenchimento do questionário. Por exemplo, se precisar calcular o índice de massa corporal (IMC), colete o peso e a estatura e deixe para calcular o IMC durante a análise.

Caso você utilize um formulário on-line, como o Google Forms, as respostas registradas corresponderão ao texto da alternativa. Mesmo nesses casos, é recomendável utilizar a codificação numérica, principalmente se sua análise estatística for além da distribuição de frequência. Análises de correlação, multivariadas e fatoriais exigem que as variáveis sejam numéricas.

Um passo importante, que geralmente é negligenciado, é a criação de um dicionário de dados, que contenha o nome, o tipo, a escala, o código e a descrição de cada variável. Ele é essencial para que você tenha a memória do banco de dados e no caso de a análise ser realizada por alguém externo ao projeto, como um consultor.

Banco de dados

A estrutura do banco de dados é definida pela complexidade do seu instrumento de coleta. Normalmente, planilhas eletrônicas, como o Excel, são suficientes para a formação do banco de dados. Alguns princípios devem ser observados:

      • cada coluna da planilha corresponderá a uma pergunta do questionário;
      • cada linha corresponderá a um único voluntário (por isso o identificar único é tão importante);
      • não se deve utilizar a função de mesclar células;
      • caso seja um estudo no qual há mais de um registro do mesmo voluntário em tempos diferentes, deve haver uma coluna específica que indique os registros em ordem cronológica. Nesses casos, o voluntário terá o número de linhas correspondente ao número de avaliações que foram feitas e a coluna de ordem dos registros permitirá diferenciar os registros do mesmo voluntário;
      • no caso de análises pareadas e com voluntários diferentes, por exemplo, em estudos caso-controle, é necessário ter uma coluna que identifique os pares.

Nos formulários on-line, será preciso incluir o identificar único a ser preenchido pelo voluntário, como o e-mail, ou CPF. Nesses casos alguns cuidados devem ser tomados. O primeiro é baixar o arquivo da nuvem e apagá-lo, por questões éticas relacionadas ao sigilo. Depois, deve-se substituir o e-mail ou CPF do voluntário por um identificador único, para mitigar o risco de quebra de sigilo.

Não se esqueça de fazer cópias de segurança.

Conclusão

A coleta e a codificação de dados são etapas fundamentais na construção de uma pesquisa sólida e confiável. Um planejamento cuidadoso e a utilização de instrumentos adequados, associados ao pré-teste, treinamento de entrevistadores e dicionário de dados, garantem a validade e a confiabilidade das informações. A codificação correta das variáveis, juntamente com um banco de dados bem estruturado, facilita a manipulação dos dados e assegura a integridade dos resultados.