Buscar
  • Andressa Kutschenko Nahas

Organização e tabulação dos dados



E então você terminou a coleta dos dados da sua pesquisa e tem aquele tanto de questionários impressos para digitar e assim poder enviar para o estatístico... E aí, como tabular os dados?


Hoje vão algumas dicas de como tabular os dados da sua pesquisa para garantir a qualidade dos dados e evitar restruturações na hora nas análises:



1. O primeiro passo é a escolha do software para digitação dos dados


Eu particularmente não tenho preferências quanto a isso, deixo livre para o pesquisador escolher o software que tem mais familiaridade. Excel, SPSS, EPi-Info... na dúvida indico o Excel mesmo, o mais básico e que todo mundo tem no computador. E mesmo que você tenha digitado os dados no SPSS e o estatístico te diga que irá usar o SAS ou R para realizar as análises, você consegue exportar os dados do SPP para formatos de Excel (xls, csv...). E a partir do SAS e R também é possível ler os dados de um arquivo SPSS, então fica tudo certo!


Em seguida, é partir para a digitação, mas não antes sem terminar de ler as dicas!



2. Codificar as variáveis qualitativas (categóricas)

  • Você pode digitar por exemplo "feminino" e "masculino" para a variável sexo, mas será que você não irá perder muito tempo digitando a palavra inteira sendo que você poderia digitar apenas "F" e "M" ou "0" e "1"? Além de que, se ora você digitar "feminino" e ora "Feminino", o software entenderá como duas coisas diferentes e você terá muita correção para fazer depois.

  • Variáveis qualitativas ordinais valem deixar com codificação numérica (0,1,2...). Na variável escolaridade, por exemplo, digitando "Sem instrução", "Ensino Fundamental", "Ensino Médio", na hora de gerar as análises, a ordem das respostas virá geralmente na ordem alfabética. Então melhor codificar por 1,2 e 3, respectivamente, por exemplo.


3. Criar um número de identificação de sujeitos no banco de dados e questionário


Manter o nome de pessoas no banco de dados pode ser desconfortável e sempre será antiético. Numere todos os questionários e use essa numeração para identificar os sujeitos no banco de dados. Essa identificação no banco de dados é essencial pois em caso de revisões de alguma variável, você localizará os questionários com maior rapidez.



4. Definir a estrutura da tabulação dos dados


Digitar os dados da maneira que será necessário para a análise de dados: na dúvida, procure orientação de um estatístico. As variáveis sempre ficam na primeira linha (cabeçalho), uma em cada coluna, sendo a primeira variável uma identificação do sujeito. E dessa maneira, em cada linha irão todas as informações de daquele sujeito. Se você fez um estudo que precisasse medir algumas informações do sujeito em dois ou mais tempos, digamos dois para exemplificar, você terá uma linha para o este indivíduo no primeiro tempo e uma segunda para este indivíduo no segundo tempo. Lembrando que é essencial ter uma variável indicadora do tempo (1 e 2, Pré e Pós, Antes e Depois, etc).


Exemplos de estrutura de banco de dados:




5. Dupla digitação dos dados


Recomenda-se que pelo menos duas pessoas façam a digitação do banco de dados e utilize alguma função para fazer a checagem da digitação. Isto minimiza consideravelmente os erros de digitação. No Excel, por exemplo, uma pessoa pode digitar numa primeira planilha e uma segunda pessoa em outra planilha, seguindo a mesma estruturação e ordem de digitação. Você pode numa terceira planilha do Excel usar uma fórmula simples para verificar se as células da primeira planilha estão iguais a célula da segunda planilha. Em caso positivo, a célula com a formula mostrará “VERDADEIRO”. Se FALSO, você deverá verificar no questionário correspondente qual é a informação verdadeira e fazer a correção na planilha incorreta.



Gostou das dicas? Foram ou serão úteis? Em caso de dúvidas e sugestões para outras postagens, estou à disposição!


Andressa Kutschenko Nahas andressa@aknconsultoria.com aknconsultoria.com


Imagem: "http://www.freepik.com">Designed by Freepik<