Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:09-lm02

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
Próxima revisão Ambos lados da revisão seguinte
cursos:planeco:roteiro:09-lm02 [2024/03/23 15:24]
127.0.0.1 edição externa
cursos:planeco:roteiro:09-lm02 [2024/03/25 13:46]
127.0.0.1 edição externa
Linha 149: Linha 149:
      * ''​prodCampo ~ solo + adubo + solo:​adubo''​      * ''​prodCampo ~ solo + adubo + solo:​adubo''​
      * interprete o resumo, comparando com o resumo do modelo similar proveniente da planilha de dados anterior      * interprete o resumo, comparando com o resumo do modelo similar proveniente da planilha de dados anterior
- 
-</​WRAP>​ 
- 
- 
-===== Simplificando Modelos ===== 
- 
-<WRAP center round box 80%> 
-{{ youtube>​5av4ffv89A0 |}} 
- 
-</​WRAP>​ 
- 
-Durante o curso usaremos o procedimento de simplificar o modelo a partir do modelo cheio. 
-O procedimento consiste em comparar modelos aninhados((o modelo mais simples está contido no mais complexo)), dois a dois, retendo o que está mais acoplado aos dados. Para comparar os modelos utilizaremos o procedimento da partição da variância baseado na tabela de anova. Quando os modelo comparados são diferentes retemos o mais complexo, pois explica mais variação dos dados ((Este é um atributo associado aos modelos aninhados: aquele que tem mais variáveis ou parâmetros só pode explicar mais ou a mesma quantidade de variação do mais simples, já que todos os parâmetros do modelo mais simples estão contidos no mais complexo)). Por outro lado, quando os modelos não são diferentes no seu poder explicativo,​ retemos o modelo mais simples, apoiados no princípio da parcimônia. Para tomar a decisão se os modelos são iguais ou diferentes utilizamos a estatística ''​F''​ da tabela de anova. ​ 
- 
- 
-<WRAP center round box 80%> 
- 
-==== Princípio da parcimônia (Navalha de Occam) ==== 
- 
-  * número de parâmetros menor possível 
-  * linear é melhor que não-linear 
-  * reter menos pressupostos 
-  * simplificar ao mínimo adequado 
-  * explicações mais simples são preferíveis 
- 
-</​WRAP>​ 
- 
-<WRAP center round box 80%> 
- 
-==== Método do modelo cheio ao mínimo adequado ==== 
- 
-  - ajuste o modelo máximo (cheio) 
-  - simplifique o modelo: 
-    * inspecione os coeficientes (summary) 
-    *  remova termos não significativos ((um de cada vez)) 
-  - ordem de remoção de termos: ​ 
-    * interações não significativas (primeiro as de maior ordem) 
-    * termos quadráticos ou não lineares 
-    * variáveis explicativas não significativas 
-  - caso faça sentido, agrupe níveis de fatores sem diferença 
-  - verifique se a ordem de remoção não interfere na seleção do modelo 
-    * retorne ao modelo cheio 
-    * retire as variáveis que não foram retidas no outro procedimento em outra ordem 
-    * confirme que o modelo mínimo adequado é o mesmo  
-  - Faça o diagnóstico do modelo mínimo adequado 
-  - Interprete o modelo selecionado ​ 
-    ​ 
- 
-</​WRAP>​ 
- 
- 
-<WRAP center round box 80%> 
- 
-==== Tomada de decisão ​ ==== 
-<WRAP center round tip 80%> 
-** A diferença não é significativa:​ ** 
-    * retenha o modelo mais simples 
-    * continue simplificando 
- 
-</​WRAP>​ 
- 
-<WRAP center round tip 80%> 
- 
-**A difereça é significativa:​ ** 
-    * retenha o modelo complexo 
-    * verifique se existe termo que pode e ainda não foi retirado ​ 
-    * caso não haja nenhum termo que possa ser retirado, este é o modelo __MINÍMO ADEQUADO__ 
- 
-</​WRAP>​ 
  
 </​WRAP>​ </​WRAP>​
Linha 414: Linha 345:
 === Combinatória === === Combinatória ===
  
-Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:+Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:
  
 $$C^{r}_{n} =  \frac{n!}{r! (n-r)!} $$ $$C^{r}_{n} =  \frac{n!}{r! (n-r)!} $$
Linha 501: Linha 432:
 Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações),​ podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "​muita"​ experiência sobre tamanhos de bebês ao nascer, "​consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são:  Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações),​ podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "​muita"​ experiência sobre tamanhos de bebês ao nascer, "​consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são: 
  
- ''​pesoKg ​~ gestation + age + weight ​+ smoke + gestation:​age + gestation:​smoke +  + ''​bebeKg ​~ gestation + age + maeKg + smoke + gestation:​age + gestation:​smoke +  
-            age:weight ​+ age:smoke + weight:smoke + gestation:​age:​smoke ''​+            age:maeKg + age:smoke + maeKg:smoke + gestation:​age:​smoke ''​
  
  
 <WRAP center round box 80%> <WRAP center round box 80%>
 +
 ==== Seleção do mínimo adequado ==== ==== Seleção do mínimo adequado ====
  
Linha 511: Linha 443:
  
  
-<​code> ​bwt ~ gestation + age + weight ​+ smoke + +<​code> ​bebeKg ​~ gestation + age + maeKg + smoke + 
             gestation:​age + gestation:​smoke +  ​             gestation:​age + gestation:​smoke +  ​
-            age:weight ​+ age:smoke + weight:smoke + +            age:maeKg + age:smoke + maeKg:smoke + 
             gestation:​age:​smoke             gestation:​age:​smoke
 </​code>​ </​code>​
 +
   * simplifique esse modelo até o mínimo adequado;   * simplifique esse modelo até o mínimo adequado;
 +
 <WRAP center round tip 80%> <WRAP center round tip 80%>
 +
 Durante o processo de simplificação,​ quando nos defrontamos com vários termos de mesma ordem não significativos,​ um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos,​ ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo"​ em um modelo mais complexo pode se tornar "​significativo"​ em um modelo mais simples. ​ Durante o processo de simplificação,​ quando nos defrontamos com vários termos de mesma ordem não significativos,​ um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos,​ ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo"​ em um modelo mais complexo pode se tornar "​significativo"​ em um modelo mais simples. ​
 +
 </​WRAP>​ </​WRAP>​
  
-  ​* interprete o resultado do modelo mínimo adequado com relação aos termos selecionados;​ +  * qual a predição do modelo selecionado do peso do bebê das seguintes mães: 
-  ​* qual a predição do modelo selecionado do peso do bebê de uma mãe de 30 anos, que teve uma gestação de 280 dias e peso de 125 pounds +      * 26 anos, 280 dias de gestação, peso 55 kg e não fumante 
-  * interprete o resultado biologicamente.+      * 26 anos, 280 dias de gestação, peso 55 kg e fumante 
 +      * 26 anos, 210 dias de gestação, peso 55 kg e não fumante 
 +      * 26 anos, 210 dias de gestação, peso 55 kg e fumante 
 +      * 26 anos, 280 dias de gestação, peso 70 kg não fumante 
 +      * 26 anos, 280 dias de gestação, ​peso 70 kg e fumante 
 +      * 26 anos, 210 dias de gestação, peso 70 kg e não fumante 
 +      * 26 anos, 210 dias de gestação, peso 70 kg e fumante 
 +  * faça as mesmas predições acima, agora para uma mãe com 35 anos; 
 +  * coloque as características da mãe e as predições do modelo para os casos acima em um planilha ((essa planilha pode ser feita no R como um ''​data.frame'',​ exportando depois como ''​csv''​));​ 
 +  * interprete o resultado ​do modelo ​biologicamente.
  
 </​WRAP>​ </​WRAP>​
Linha 531: Linha 476:
 ==== Tamanho e sobrepeso da mãe ==== ==== Tamanho e sobrepeso da mãe ====
  
-Um "outro especialista"​ ao analisar o modelo mínimo adequado selecionado acima afirmou que deveria incluir ​a variável ''​height''​ para controlar o peso do bebe ser maior apenas porque a mãe era grande. ​  Além disso sugeriu incluir uma nova variável que indicasse a quanto a gestante ​tem de sobrepeso ou subpeso. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como respotas ​e a variável altura como preditora. Todos os "​outros especialistas"​ concordaram que essa era uma boa sugestão, já que essa nova variável representa o quanto a gestante ​tem mais peso ou menos peso do que esperado para uma gestante ​com a sua altura.  ​+Um "outro especialista"​ao analisar o modelo mínimo adequado selecionado acimaafirmou que a variável ''​height'' ​deveria ser incluida ​para controlar o peso do bebê ser maior apenas porque a mãe era grande. ​  Além dissosugeriu incluir uma nova variável que indicasse a quanto a mãe tem de sobrepeso ou subpeso ​antes de engravidar. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como resposta ​e a variável altura como preditora. Todos os "​outros especialistas"​ concordaram que  ​eram ​uma boa sugestão, já que essa nova variável representa o quanto a mãe tem mais peso ou menos peso do que esperado para uma mãe com a mesma altura.  ​
    
 <WRAP center round box 80%> <WRAP center round box 80%>
Linha 540: Linha 485:
   * cronstrua um segundo modelo que inclua ''​resPeso''​ agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores;   * cronstrua um segundo modelo que inclua ''​resPeso''​ agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores;
   * compare os resumos de ambos os modelos e anote as diferenças encontradas;​   * compare os resumos de ambos os modelos e anote as diferenças encontradas;​
-  * no menu ''​Estatísticas''​ > ''​Resumos''​ > ''​Teste de correlação''​ selecione as variáveis ''​resPeso''​ e ''​weight'',​ anote o valor da correlação entre essas variáveis;+  * no menu ''​Estatísticas''​ > ''​Resumos''​ > ''​Teste de correlação''​ selecione as variáveis ''​resPeso''​ e ''​maeKg'',​ anote o valor da correlação entre essas variáveis;
 {{  :​cursos:​planeco:​roteiro:​corPeso.png?​700 ​ |}} {{  :​cursos:​planeco:​roteiro:​corPeso.png?​700 ​ |}}
   * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante;   * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante;
Linha 634: Linha 579:
 <WRAP center round help 90%> <WRAP center round help 90%>
  
-Responda o  [[https://​forms.gle/​qZg13LsMEG2xHRAe6|o formulário MLM III]] incluindo arquivos de resultados ​e figuras ​quando solicitado. ​+Responda o  [[https://​forms.gle/​wBbBoyssUMqSmurL8|o formulário MLM I]] incluindo arquivos de resultados quando solicitado. ​
  
  
Linha 705: Linha 650:
  
  
 +
 +/*
  
 ==== O que preciso entregar ==== ==== O que preciso entregar ====
Linha 719: Linha 666:
 {{url>​https://​forms.gle/​LvN2j8iE7JWpeEBr9}} {{url>​https://​forms.gle/​LvN2j8iE7JWpeEBr9}}
  
 +*/
cursos/planeco/roteiro/09-lm02.txt · Última modificação: 2024/03/25 13:51 (edição externa)