AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal dando um presente Stata FAQ Como posso recodificar valores perdidos em diferentes categorias A Stata nos permite codificar diferentes tipos de valores em falta numéricos. Possui 27 categorias desaparecidas numéricas. Quot. a quot. z quot e quot. Quot. Nesta página, mostraremos como codificar valores em falta em diferentes categorias. Primeiro criamos um conjunto de dados com a finalidade de ilustração. Neste conjunto de dados, todas as variáveis são numéricas e as variáveis femininas e ses têm valores faltantes. Os valores não faltantes para fêmeas variáveis são 0 (para masculino) e 1 (para fêmea). Os valores não faltantes para variables ses são 0 (baixo), 1 (med) e 2 (alto). O resto dos valores são considerados valores faltantes. Digamos que queremos codificar -999 em uma categoria, -99 em outro e o resto dos valores em falta em uma terceira categoria para todas as variáveis. Método 1: Usando o comando replace Nós podemos substituir os valores faltantes manualmente por quot. a quot for -999, quot. b quot for -99 e. c pelo resto dos valores faltantes. Por exemplo, para variável feminino. Podemos fazer o seguinte: o comando do livro de códigos acima mostra que a fêmea variável possui três tipos de valores ausentes e 4 valores faltantes. Método 2: Usando o comando mvdecode O método 1 pode não ser a melhor maneira de recodificar valores faltantes em diferentes categorias. Por um lado, temos que fazer uma variável de cada vez. O comando Statas mvdecode é útil para nós. Melhor ainda, podemos usar a palavra-chave para referir todas as variáveis no conjunto de dados. Passando dos códigos de valores em falta para valores numéricos O outro problema que abordaremos aqui é como mudar os códigos de valores em falta de volta aos valores numéricos. O comando mvencode é emparelhado com o comando mvdecode que acabamos de abordar acima e é o único a usar aqui. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software da Universidade da Califórnia. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar Manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisas Digitais e Educação Ajude o Grupo de Consultoria Estatal, dando um presente Notas da Classe Stata Contagem de n para N Introdução A Stata possui duas variáveis incorporadas chamadas n e N. N é a notação Stata para o número de observação atual. N é 1 na primeira observação, 2 no segundo, 3 no terceiro e assim por diante. N é a notação de Stata para o número total de observações. Vamos ver como n e N funcionam. Como você pode ver, o ID da variável contém o número de observação que corre de 1 a 7 e nt é o número total de observações, que é 7. Contar com o uso de n e N em conjunto com o comando pode produzir alguns resultados muito úteis. É claro que, para usar o comando por nós, primeiro devemos classificar nossos dados na variável por variável. Agora n1 é o número de observação dentro de cada grupo e n2 é o número total de observações para cada grupo. Para listar a pontuação mais baixa para cada grupo, use o seguinte: Para listar a pontuação mais alta para cada grupo, use o seguinte: Outro uso de n Permite usar n para descobrir se existem números de identificação duplicados nos seguintes dados: As observações 6 e 7 têm os mesmos números de identificação e valores de pontuação diferentes. Encontrando Duplicados Agora, use N para encontrar observações duplicadas. Neste exemplo, classificamos as observações por todas as variáveis. Em seguida, usamos toda a variável na instrução by e definimos set n igual ao número total de observações que são idênticas. Finalmente, listamos as observações para as quais N é maior que 1, identificando as observações duplicadas. Se você tem muitas variáveis no conjunto de dados, pode demorar muito tempo para digitá-las duas vezes. Podemos fazer uso do curinga para indicar que desejamos usar todas as variáveis. Além disso, nas versões mais recentes do Stata, podemos combinar classificar e em uma única declaração. Abaixo está uma versão simplificada do código que renderá exatamente os mesmos resultados acima. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.
No comments:
Post a Comment