Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:09-lm02

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
cursos:planeco:roteiro:09-lm02 [2024/03/23 14:01]
127.0.0.1 edição externa
cursos:planeco:roteiro:09-lm02 [2024/03/25 13:51] (atual)
Linha 355: Linha 355:
         * ''​age'':​ idade da mãe (anos)         * ''​age'':​ idade da mãe (anos)
         * ''​height'':​ altura da mãe (polegadas)         * ''​height'':​ altura da mãe (polegadas)
-        * ''​weight'':​ peso da mãe (kg)+        * ''​weight'':​ peso da mãe (libras)
         * ''​smoke'':​ 0 não fumante; 1 fumante         * ''​smoke'':​ 0 não fumante; 1 fumante
        
 </​WRAP>​ </​WRAP>​
  
-Notem que as preditoras estão relacionadas a características da mãe: dias de gestação, idade, peso, altura e se ela é fumante ou não. Como a variável resposta, peso do bebê ao nascer, foi medida em ''​onças'',​ vamos transformar em uma escala de medida que temos mais facilidade para  interpretar,​ multiplicando essa variável por ''​0.02835''​ para transformar em ''​kg''​.+Notem que as preditoras estão relacionadas a características da mãe: dias de gestação, idade, peso, altura e se ela é fumante ou não. Como a variável resposta, peso do bebê ao nascer, foi medida em ''​onças'',​ vamos transformar em uma escala de medida que temos mais facilidade para  interpretar,​ multiplicando essa variável por ''​0.02835''​ para transformar ​em ''​kg''​. Vamos fazer o mesmo para o peso da mãe que foi medido em libras e deve ser multiplicada por ''​0.453592''​ para ser transformada ​em ''​kg''​.
  
 <WRAP center round box 80%> <WRAP center round box 80%>
Linha 367: Linha 367:
   * Garanta que os dados foram lidos corretamente;​   * Garanta que os dados foram lidos corretamente;​
   * Abra a janela para criar uma nova variável no menu ''​Data > Manage variables in active data set > Compute a new variable'';​   * Abra a janela para criar uma nova variável no menu ''​Data > Manage variables in active data set > Compute a new variable'';​
-  * Na caixa ''​New variable name''​ nomei a nova variável como ''​pesoKg'';​+  * Na caixa ''​New variable name''​ nomei a nova variável como ''​bebeKg'';​
   * Na caixa ''​Expression to compute''​ coloque a expressão: ''​bwt * 0.02835'';​   * Na caixa ''​Expression to compute''​ coloque a expressão: ''​bwt * 0.02835'';​
 +  * Em seguida crie a variável ''​maeKg''​ multiplicando ''​weight''​ por ''​0.453592''​.
 </​WRAP>​ </​WRAP>​
  
Linha 376: Linha 377:
  
 <WRAP center round important 90%> <WRAP center round important 90%>
-Para simplificar nosso exemplo, vamos deixar de lado duas variáveis preditoras que foram coletadas nesse estudo: ''​parity''​ e ''​weight''​. Ao final ficamos com quatro variáveis preditoras:​ +Para simplificar nosso exemplo, vamos deixar de lado duas variáveis preditoras que foram coletadas nesse estudo: ''​parity''​ e ''​height''​. Ao final ficamos com quatro variáveis preditoras:​ 
- ''​gestation'',​ ''​age'',​ ''​height''​ e ''​smoke'' ​     ​+ ''​gestation'',​ ''​age'',​ ''​maeKg''​ e ''​smoke'' ​     ​
  
 </​WRAP>​ </​WRAP>​
Linha 389: Linha 390:
  
 <WRAP center round box 80%> <WRAP center round box 80%>
-No menu ''​Estatísticas > Ajustes de modelos > Modelo linear...'',​ construa o modelo ''​lmFull''​ com todas as quatro preditoras ((''​gestation'',​ ''​age'',​ ''​height''​ e ''​smoke''​)) e suas interações. O modelo resultante tem a seguinte expressão:+No menu ''​Estatísticas > Ajustes de modelos > Modelo linear...'',​ construa o modelo ''​lmFull''​ com todas as quatro preditoras ((''​gestation'',​ ''​age'',​ ''​maeKg''​ e ''​smoke''​)) e suas interações. O modelo resultante tem a seguinte expressão:
  
-<​code> ​pesoKg ​~ age * gestation * height ​* smoke</​code>​+<​code> ​bebeKg ​~ age * gestation * maeKg * smoke</​code>​
  
 Na linguagem R os símbolos de ''​*''​ em expressões de notação de modelos representa tanto a variável isoladamente quanto as interações possíveis. ​ Na linguagem R os símbolos de ''​*''​ em expressões de notação de modelos representa tanto a variável isoladamente quanto as interações possíveis. ​
Linha 413: Linha 414:
 === Combinatória === === Combinatória ===
  
-Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:+Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:
  
 $$C^{r}_{n} =  \frac{n!}{r! (n-r)!} $$ $$C^{r}_{n} =  \frac{n!}{r! (n-r)!} $$
Linha 434: Linha 435:
  
  
-  * ''​gestation:​age:​weight:​smokeTRUE''​ +  * ''​gestation:​age:​maeKg:​smokeTRUE''​ 
-  * ''​age:​gestation:​height''​+  * ''​age:​gestation:​maeKg''​
   * ''​age:​gestation:​smoke''​   * ''​age:​gestation:​smoke''​
-  * ''​age:​height:​smoke''​ +  * ''​age:​maeKg:​smoke''​ 
-  * ''​gestation:​height:​smoke''​+  * ''​gestation:​maeKg:​smoke''​
  
 As interações duplas: As interações duplas:
  
   * ''​age:​gestation'' ​   * ''​age:​gestation'' ​
-  * ''​age:​height''​+  * ''​age:​maeKg''​
   * ''​age:​smoke''​   * ''​age:​smoke''​
-  * ''​gestation:​height''​+  * ''​gestation:​maeKg''​
   * ''​gestation:​smoke'' ​   * ''​gestation:​smoke'' ​
-  * ''​height:​smoke'' ​+  * ''​maeKg:​smoke'' ​
  
 Além dessas, temos os termos isolados para cada variável e o intercepto do modelo, totalizando os 16 termos do modelo ''​lmFull''​. ​ Além dessas, temos os termos isolados para cada variável e o intercepto do modelo, totalizando os 16 termos do modelo ''​lmFull''​. ​
Linha 468: Linha 469:
  
   * Produza o modelo nulo chamado ''​lmNull''​ com a formula:   * Produza o modelo nulo chamado ''​lmNull''​ com a formula:
-      * ''​pesoKg ​~ 1''​+      * ''​bebeKg ​~ 1''​
   * compare com o modelo cheio produzido acima ''​lmFull''​ utilizando a função:   * compare com o modelo cheio produzido acima ''​lmFull''​ utilizando a função:
       * ''​anova(lmNull,​ lmFull)''​       * ''​anova(lmNull,​ lmFull)''​
Linha 481: Linha 482:
  
  
-''​age:​gestation:​height:​smoke[T.TRUE]''​+''​age:​gestation:​maeKg:​smoke[T.TRUE]''​
  
  
Linha 498: Linha 499:
 ===== Modelo Cheio ===== ===== Modelo Cheio =====
  
-Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações),​ podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "​muita"​ experiência sobre tamanhos de bebes ao nascer, "​consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são: +Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações),​ podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "​muita"​ experiência sobre tamanhos de bebês ​ao nascer, "​consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são: 
  
- ''​pesoKg ​~ gestation + age + weight ​+ smoke + gestation:​age + gestation:​smoke +  + ''​bebeKg ​~ gestation + age + maeKg + smoke + gestation:​age + gestation:​smoke +  
-            age:weight ​+ age:smoke + weight:smoke + gestation:​age:​smoke ''​+            age:maeKg + age:smoke + maeKg:smoke + gestation:​age:​smoke ''​
  
  
 <WRAP center round box 80%> <WRAP center round box 80%>
 +
 ==== Seleção do mínimo adequado ==== ==== Seleção do mínimo adequado ====
  
Linha 510: Linha 512:
  
  
-<​code> ​bwt ~ gestation + age + weight ​+ smoke + +<​code> ​bebeKg ​~ gestation + age + maeKg + smoke + 
             gestation:​age + gestation:​smoke +  ​             gestation:​age + gestation:​smoke +  ​
-            age:weight ​+ age:smoke + weight:smoke + +            age:maeKg + age:smoke + maeKg:smoke + 
             gestation:​age:​smoke             gestation:​age:​smoke
 </​code>​ </​code>​
 +
   * simplifique esse modelo até o mínimo adequado;   * simplifique esse modelo até o mínimo adequado;
 +
 <WRAP center round tip 80%> <WRAP center round tip 80%>
 +
 Durante o processo de simplificação,​ quando nos defrontamos com vários termos de mesma ordem não significativos,​ um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos,​ ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo"​ em um modelo mais complexo pode se tornar "​significativo"​ em um modelo mais simples. ​ Durante o processo de simplificação,​ quando nos defrontamos com vários termos de mesma ordem não significativos,​ um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos,​ ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo"​ em um modelo mais complexo pode se tornar "​significativo"​ em um modelo mais simples. ​
 +
 </​WRAP>​ </​WRAP>​
  
-  * interprete o resultado ​do modelo ​mínimo adequado ​com relação aos termos selecionados+  * qual a predição ​do modelo ​selecionado do peso do bebê das seguintes mães: 
-  * interprete o resultado biologicamente.+      * 26 anos, 280 dias de gestação, peso 55 kg e não fumante 
 +      * 26 anos, 280 dias de gestação, peso 55 kg e fumante 
 +      * 26 anos, 210 dias de gestação, peso 55 kg e não fumante 
 +      * 26 anos, 210 dias de gestação, peso 55 kg e fumante 
 +      * 26 anos, 280 dias de gestação, peso 70 kg e não fumante 
 +      * 26 anos, 280 dias de gestação, peso 70 kg e fumante 
 +      * 26 anos, 210 dias de gestação, peso 70 kg e não fumante 
 +      * 26 anos, 210 dias de gestação, peso 70 kg e fumante 
 +  * faça as mesmas predições acima, agora para uma mãe com 35 anos; 
 +  * coloque as características da mãe e as predições do modelo para os casos acima em um planilha ((essa planilha pode ser feita no R como um ''​data.frame'',​ exportando depois como ''​csv''​))
 +  * interprete o resultado ​do modelo ​biologicamente.
  
 </​WRAP>​ </​WRAP>​
Linha 529: Linha 545:
 ==== Tamanho e sobrepeso da mãe ==== ==== Tamanho e sobrepeso da mãe ====
  
-Um "outro especialista"​ ao analisar o modelo mínimo adequado selecionado acima afirmou que deveria incluir ​a variável ''​height''​ para controlar o peso do bebe ser maior apenas porque a mãe era grande. ​  Além disso sugeriu incluir uma nova variável que indicasse a quanto a gestante ​tem de sobrepeso ou subpeso. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como respotas ​e a variável altura como preditora. Todos os "​outros especialistas"​ concordaram que essa era uma boa sugestão, já que essa nova variável representa o quanto a gestante ​tem mais peso ou menos peso do que esperado para uma gestante ​com a sua altura.  ​+Um "outro especialista"​ao analisar o modelo mínimo adequado selecionado acimaafirmou que a variável ''​height'' ​deveria ser incluida ​para controlar o peso do bebê ser maior apenas porque a mãe era grande. ​  Além dissosugeriu incluir uma nova variável que indicasse a quanto a mãe tem de sobrepeso ou subpeso ​antes de engravidar. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como resposta ​e a variável altura como preditora. Todos os "​outros especialistas"​ concordaram que  ​eram ​uma boa sugestão, já que essa nova variável representa o quanto a mãe tem mais peso ou menos peso do que esperado para uma mãe com a mesma altura.  ​
    
 <WRAP center round box 80%> <WRAP center round box 80%>
Linha 538: Linha 554:
   * cronstrua um segundo modelo que inclua ''​resPeso''​ agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores;   * cronstrua um segundo modelo que inclua ''​resPeso''​ agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores;
   * compare os resumos de ambos os modelos e anote as diferenças encontradas;​   * compare os resumos de ambos os modelos e anote as diferenças encontradas;​
-  * no menu ''​Estatísticas''​ > ''​Resumos''​ > ''​Teste de correlação''​ selecione as variáveis ''​resPeso''​ e ''​weight'',​ anote o valor da correlação entre essas variáveis;+  * no menu ''​Estatísticas''​ > ''​Resumos''​ > ''​Teste de correlação''​ selecione as variáveis ''​resPeso''​ e ''​maeKg'',​ anote o valor da correlação entre essas variáveis;
 {{  :​cursos:​planeco:​roteiro:​corPeso.png?​700 ​ |}} {{  :​cursos:​planeco:​roteiro:​corPeso.png?​700 ​ |}}
   * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante;   * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante;
Linha 632: Linha 648:
 <WRAP center round help 90%> <WRAP center round help 90%>
  
-Responda o  [[https://​forms.gle/​qZg13LsMEG2xHRAe6|o formulário MLM III]] incluindo arquivos de resultados ​e figuras ​quando solicitado. ​+Responda o  [[https://​forms.gle/​wBbBoyssUMqSmurL8|o formulário MLM I]] incluindo arquivos de resultados quando solicitado. ​
  
- 
-{{url>​https://​forms.gle/​qZg13LsMEG2xHRAe6}} 
  
 </​WRAP>​ </​WRAP>​
Linha 705: Linha 719:
  
  
 +
 +/*
  
 ==== O que preciso entregar ==== ==== O que preciso entregar ====
Linha 719: Linha 735:
 {{url>​https://​forms.gle/​LvN2j8iE7JWpeEBr9}} {{url>​https://​forms.gle/​LvN2j8iE7JWpeEBr9}}
  
 +*/
cursos/planeco/roteiro/09-lm02.1711213318.txt.gz · Última modificação: 2024/03/23 14:01 por 127.0.0.1