Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:09-lm02

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
cursos:planeco:roteiro:09-lm02 [2024/03/23 15:22]
127.0.0.1 edição externa
cursos:planeco:roteiro:09-lm02 [2024/03/25 13:48]
127.0.0.1 edição externa
Linha 61: Linha 61:
  
  
-=====  Modelos ​Plausíves ​=====+=====  Modelos ​Plausíveis ​=====
  
  
Linha 85: Linha 85:
  
 */  */ 
- 
- 
-==== Interação entre preditoras ==== 
- 
-<WRAP center round box 80%> 
-{{ youtube>​Mx9skekN6e8 |}} 
- 
-</​WRAP>​ 
- 
-Nos modelos acima, desconsideramos um elemento importante que emerge quanto temos mais de uma preditora, a possibilidade de uma variável preditora interferir no efeito de outra, efeito esse chamado de interação. 
-A interação é um elemento muito importante quando temos mais de uma preditora, pois desconsiderá-la pode limitar o entendimento dos processos envolvidos. Um exemplo cotidiano da interação é visto no uso de medicamentos e o alerta da bula sobre interação medicamentosa ou efeitos colaterais para pessoas portadoras de doenças crônicas. Dizemos que um medicamento tem interação com outra substância quando o seu efeito é modificado pela presença de outra substância,​ como por exemplo a ingestão de álcool junto com muitos medicamentos. Nos modelos a interação tem uma interpretação similar, a resposta pelo efeito de uma variável preditora se altera com a presença de outra preditora. Muitas vezes a interação pode ser o efeito de interesse do estudo, como na pergunta: //O efeito de solo na produtividade agrícola ​ depende da quantidade de adubo orgânico adicionado?//​ Ou em outras palavras: //O efeito da adubação orgânica depende do tipo de solo?// ​ Note que nestas perguntas o foco não é se há ou não efeito do adubo ou solo, mas se a presença de uma variável afeta o efeito de outra.  ​ 
- 
- 
-<WRAP center round todo 80%> 
- 
-  * No conjunto de modelos acima, não incluímos o termo da interação. Produza o modelo abaixo incluindo o termo da interação e avalie esse modelo e seus coeficientes. 
-  
-    ''​prodCampo ~ solo + adubo + solo:​adubo''​ 
-  
- 
-</​WRAP>​ 
- 
- 
-Não é esperado encontrar interação entre as preditoras nos dados simulados da maneira como fizemos, ele pode emergir por acaso, apenas porque temos uma variável aleatória ((se o termo da interação foi significativo,​ confira os cálculos e mantenha o resultado como está, esse resultado emerge com baixa frequência,​ simplesmente por acaso. )). Da maneira como simulamos os dados temos duas preditoras que tem efeitos ​ aditivos onde não há interação. Uma outra forma de dizer isso é que o efeito do ''​adubo''​ não interfere no efeito do ''​solo'',​ ou que esses efeitos são independentes. A interpretação biológica nesse caso também pode ser feita independentemente. ​ 
- 
- 
- 
- 
-======= Simulando dados com interação ======= 
- 
-Seguindo a mesma abordagem anterior, vamos produzir dados simulando a interação entre as variáveis ''​solo''​ e ''​adubo''​. Para isso precisamos produzir dados em que o efeito do adubo depende do tipo de solo. 
- 
- 
-  - Abra o arquivo {{ :​cursos:​planeco:​roteiro:​cropMult.xlsx |cropMulti}} em uma planilha eletrônica:​ 
- 
-<WRAP center round box 80%> 
- 
-{{ :​cursos:​planeco:​roteiro:​cropMult01.jpg?​500 |  }} 
-</​WRAP>​ 
-  
-  - Preencha a coluna ''​efeitoAdubo''​ com os valores: 
-    * 2.7 para ''​arenoso''​ com ''​adubo''​ igual a ''​sim'' ​ 
-    * 0.7 para ''​argiloso''​ com ''​adubo''​ igual a ''​sim'' ​ 
-    * 0.2 para ''​humico''​ com ''​adubo''​ igual a ''​sim'' ​ 
-  - O campos da coluna ''​efeitoAdubo''​ onde ''​adubo''​ é igual a ''​não''​ devem ser preenchidos com ''​0'' ​ 
-  - Preencha a célula ** E2** da coluna ''​desvios normal''​ com a fórmula //** = INV.NORM.N(ALEATÓRIO();​ 0 ; 1.5)**//​((Essa expressão retorna valores associados a uma distribuição normal com média 0 e desvio padrão 1.5. Para versões antigas do libreoffice a função pode ser ''​ = NORM.INV(RAND(),​ 0, 1.5)''​)),​ as atuais utilizam a mesma que o excel. 
-  - Some na coluna ''​prodCampo''​ os valores ''​prodSolo + efeitoAdubo + desviosNormal'' ​ 
- 
-Ao final sua planilha deve estar preenchida como a que segue, apenas com os valores da coluna resíduo diferentes: 
- 
-<WRAP center round box 80%> 
- 
-{{ :​cursos:​planeco:​roteiro:​cropMult02.jpg?​500 |}} 
-</​WRAP>​ 
-  
-<WRAP center round tip 80%> 
-__**Procedimentos**__ 
- 
-  - Salve a planilha com o nome ''​soloAduboInteracao.csv'';​ 
-  - Importe os dados para o Rcmdr. **Atenção nomeie os dados na aba de importação com o nome ''​soloAduboInt'',​ em alguns casos o Rcmdr não importa se a planilha e os dados importados tiverem o mesmo nome de uma importação anterior** 
-  - Confira se os dados foram lidos corretamente,​ inclusive se a decimal é ''​.'';​ 
-  - Produza o modelo cheio ''​mlSolo_AduboAll''​ com a seguinte formula: 
-     * ''​prodCampo ~ solo + adubo + solo:​adubo''​ 
-     * interprete o resumo, comparando com o resumo do modelo similar proveniente da planilha de dados anterior 
- 
-</​WRAP>​ 
- 
  
 ===== Simplificando Modelos ===== ===== Simplificando Modelos =====
Linha 218: Linha 151:
  
 </​WRAP>​ </​WRAP>​
 +
 +</​WRAP>​
 +
 +
 +<WRAP center round box 60%>
 +  * compare os modelos plausíveis do tópico anterior;
 +  * interprete o modelo mínimo adequado.
 +</​WRAP>​
 +
 +
 +==== Interação entre preditoras ====
 +
 +<WRAP center round box 80%>
 +{{ youtube>​Mx9skekN6e8 |}}
 +
 +</​WRAP>​
 +
 +Nos modelos acima, desconsideramos um elemento importante que emerge quanto temos mais de uma preditora, a possibilidade de uma variável preditora interferir no efeito de outra, efeito esse chamado de interação.
 +A interação é um elemento muito importante quando temos mais de uma preditora, pois desconsiderá-la pode limitar o entendimento dos processos envolvidos. Um exemplo cotidiano da interação é visto no uso de medicamentos e o alerta da bula sobre interação medicamentosa ou efeitos colaterais para pessoas portadoras de doenças crônicas. Dizemos que um medicamento tem interação com outra substância quando o seu efeito é modificado pela presença de outra substância,​ como por exemplo a ingestão de álcool junto com muitos medicamentos. Nos modelos a interação tem uma interpretação similar, a resposta pelo efeito de uma variável preditora se altera com a presença de outra preditora. Muitas vezes a interação pode ser o efeito de interesse do estudo, como na pergunta: //O efeito de solo na produtividade agrícola ​ depende da quantidade de adubo orgânico adicionado?//​ Ou em outras palavras: //O efeito da adubação orgânica depende do tipo de solo?// ​ Note que nestas perguntas o foco não é se há ou não efeito do adubo ou solo, mas se a presença de uma variável afeta o efeito de outra.  ​
 +
 +
 +<WRAP center round todo 80%>
 +
 +  * No conjunto de modelos acima, não incluímos o termo da interação. Produza o modelo abaixo incluindo o termo da interação e avalie esse modelo e seus coeficientes.
 + 
 +    ''​prodCampo ~ solo + adubo + solo:​adubo''​
 + 
 +
 +</​WRAP>​
 +
 +
 +Não é esperado encontrar interação entre as preditoras nos dados simulados da maneira como fizemos, ele pode emergir por acaso, apenas porque temos uma variável aleatória ((se o termo da interação foi significativo,​ confira os cálculos e mantenha o resultado como está, esse resultado emerge com baixa frequência,​ simplesmente por acaso. )). Da maneira como simulamos os dados temos duas preditoras que tem efeitos ​ aditivos onde não há interação. Uma outra forma de dizer isso é que o efeito do ''​adubo''​ não interfere no efeito do ''​solo'',​ ou que esses efeitos são independentes. A interpretação biológica nesse caso também pode ser feita independentemente. ​
 +
 +
 +
 +
 +======= Simulando dados com interação =======
 +
 +Seguindo a mesma abordagem anterior, vamos produzir dados simulando a interação entre as variáveis ''​solo''​ e ''​adubo''​. Para isso precisamos produzir dados em que o efeito do adubo depende do tipo de solo.
 +
 +
 +  - Abra o arquivo {{ :​cursos:​planeco:​roteiro:​cropMult.xlsx |cropMulti}} em uma planilha eletrônica:​
 +
 +<WRAP center round box 80%>
 +
 +{{ :​cursos:​planeco:​roteiro:​cropMult01.jpg?​500 |  }}
 +</​WRAP>​
 + 
 +  - Preencha a coluna ''​efeitoAdubo''​ com os valores:
 +    * 2.7 para ''​arenoso''​ com ''​adubo''​ igual a ''​sim'' ​
 +    * 0.7 para ''​argiloso''​ com ''​adubo''​ igual a ''​sim'' ​
 +    * 0.2 para ''​humico''​ com ''​adubo''​ igual a ''​sim'' ​
 +  - O campos da coluna ''​efeitoAdubo''​ onde ''​adubo''​ é igual a ''​não''​ devem ser preenchidos com ''​0'' ​
 +  - Preencha a célula ** E2** da coluna ''​desvios normal''​ com a fórmula //** = INV.NORM.N(ALEATÓRIO();​ 0 ; 1.5)**//​((Essa expressão retorna valores associados a uma distribuição normal com média 0 e desvio padrão 1.5. Para versões antigas do libreoffice a função pode ser ''​ = NORM.INV(RAND(),​ 0, 1.5)''​)),​ as atuais utilizam a mesma que o excel.
 +  - Some na coluna ''​prodCampo''​ os valores ''​prodSolo + efeitoAdubo + desviosNormal'' ​
 +
 +Ao final sua planilha deve estar preenchida como a que segue, apenas com os valores da coluna resíduo diferentes:
 +
 +<WRAP center round box 80%>
 +
 +{{ :​cursos:​planeco:​roteiro:​cropMult02.jpg?​500 |}}
 +</​WRAP>​
 + 
 +<WRAP center round tip 80%>
 +__**Procedimentos**__
 +
 +  - Salve a planilha com o nome ''​soloAduboInteracao.csv'';​
 +  - Importe os dados para o Rcmdr. **Atenção nomeie os dados na aba de importação com o nome ''​soloAduboInt'',​ em alguns casos o Rcmdr não importa se a planilha e os dados importados tiverem o mesmo nome de uma importação anterior**
 +  - Confira se os dados foram lidos corretamente,​ inclusive se a decimal é ''​.'';​
 +  - Produza o modelo cheio ''​mlSolo_AduboAll''​ com a seguinte formula:
 +     * ''​prodCampo ~ solo + adubo + solo:​adubo''​
 +     * interprete o resumo, comparando com o resumo do modelo similar proveniente da planilha de dados anterior
  
 </​WRAP>​ </​WRAP>​
Linha 392: Linha 397:
 No menu ''​Estatísticas > Ajustes de modelos > Modelo linear...'',​ construa o modelo ''​lmFull''​ com todas as quatro preditoras ((''​gestation'',​ ''​age'',​ ''​maeKg''​ e ''​smoke''​)) e suas interações. O modelo resultante tem a seguinte expressão: No menu ''​Estatísticas > Ajustes de modelos > Modelo linear...'',​ construa o modelo ''​lmFull''​ com todas as quatro preditoras ((''​gestation'',​ ''​age'',​ ''​maeKg''​ e ''​smoke''​)) e suas interações. O modelo resultante tem a seguinte expressão:
  
-<​code> ​pesoKg ​~ age * gestation * maeKg * smoke</​code>​+<​code> ​bebeKg ​~ age * gestation * maeKg * smoke</​code>​
  
 Na linguagem R os símbolos de ''​*''​ em expressões de notação de modelos representa tanto a variável isoladamente quanto as interações possíveis. ​ Na linguagem R os símbolos de ''​*''​ em expressões de notação de modelos representa tanto a variável isoladamente quanto as interações possíveis. ​
Linha 414: Linha 419:
 === Combinatória === === Combinatória ===
  
-Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:+Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:
  
 $$C^{r}_{n} =  \frac{n!}{r! (n-r)!} $$ $$C^{r}_{n} =  \frac{n!}{r! (n-r)!} $$
Linha 448: Linha 453:
   * ''​gestation:​maeKg''​   * ''​gestation:​maeKg''​
   * ''​gestation:​smoke'' ​   * ''​gestation:​smoke'' ​
-  * ''​height:​smoke'' ​+  * ''​maeKg:​smoke'' ​
  
 Além dessas, temos os termos isolados para cada variável e o intercepto do modelo, totalizando os 16 termos do modelo ''​lmFull''​. ​ Além dessas, temos os termos isolados para cada variável e o intercepto do modelo, totalizando os 16 termos do modelo ''​lmFull''​. ​
Linha 469: Linha 474:
  
   * Produza o modelo nulo chamado ''​lmNull''​ com a formula:   * Produza o modelo nulo chamado ''​lmNull''​ com a formula:
-      * ''​pesoKg ​~ 1''​+      * ''​bebeKg ​~ 1''​
   * compare com o modelo cheio produzido acima ''​lmFull''​ utilizando a função:   * compare com o modelo cheio produzido acima ''​lmFull''​ utilizando a função:
       * ''​anova(lmNull,​ lmFull)''​       * ''​anova(lmNull,​ lmFull)''​
Linha 501: Linha 506:
 Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações),​ podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "​muita"​ experiência sobre tamanhos de bebês ao nascer, "​consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são:  Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações),​ podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "​muita"​ experiência sobre tamanhos de bebês ao nascer, "​consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são: 
  
- ''​pesoKg ​~ gestation + age + weight ​+ smoke + gestation:​age + gestation:​smoke +  + ''​bebeKg ​~ gestation + age + maeKg + smoke + gestation:​age + gestation:​smoke +  
-            age:weight ​+ age:smoke + weight:smoke + gestation:​age:​smoke ''​+            age:maeKg + age:smoke + maeKg:smoke + gestation:​age:​smoke ''​
  
  
 <WRAP center round box 80%> <WRAP center round box 80%>
 +
 ==== Seleção do mínimo adequado ==== ==== Seleção do mínimo adequado ====
  
Linha 511: Linha 517:
  
  
-<​code> ​bwt ~ gestation + age + weight ​+ smoke + +<​code> ​bebeKg ​~ gestation + age + maeKg + smoke + 
             gestation:​age + gestation:​smoke +  ​             gestation:​age + gestation:​smoke +  ​
-            age:weight ​+ age:smoke + weight:smoke + +            age:maeKg + age:smoke + maeKg:smoke + 
             gestation:​age:​smoke             gestation:​age:​smoke
 </​code>​ </​code>​
 +
   * simplifique esse modelo até o mínimo adequado;   * simplifique esse modelo até o mínimo adequado;
 +
 <WRAP center round tip 80%> <WRAP center round tip 80%>
 +
 Durante o processo de simplificação,​ quando nos defrontamos com vários termos de mesma ordem não significativos,​ um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos,​ ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo"​ em um modelo mais complexo pode se tornar "​significativo"​ em um modelo mais simples. ​ Durante o processo de simplificação,​ quando nos defrontamos com vários termos de mesma ordem não significativos,​ um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos,​ ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo"​ em um modelo mais complexo pode se tornar "​significativo"​ em um modelo mais simples. ​
 +
 </​WRAP>​ </​WRAP>​
  
-  ​* interprete o resultado do modelo mínimo adequado com relação aos termos selecionados;​ +  * qual a predição do modelo selecionado do peso do bebê das seguintes mães: 
-  ​* qual a predição do modelo selecionado do peso do bebê de uma mãe de 30 anos, que teve uma gestação de 280 dias e peso de 125 pounds +      * 26 anos, 280 dias de gestação, peso 55 kg e não fumante 
-  * interprete o resultado biologicamente.+      * 26 anos, 280 dias de gestação, peso 55 kg e fumante 
 +      * 26 anos, 210 dias de gestação, peso 55 kg e não fumante 
 +      * 26 anos, 210 dias de gestação, peso 55 kg e fumante 
 +      * 26 anos, 280 dias de gestação, peso 70 kg não fumante 
 +      * 26 anos, 280 dias de gestação, ​peso 70 kg e fumante 
 +      * 26 anos, 210 dias de gestação, peso 70 kg e não fumante 
 +      * 26 anos, 210 dias de gestação, peso 70 kg e fumante 
 +  * faça as mesmas predições acima, agora para uma mãe com 35 anos; 
 +  * coloque as características da mãe e as predições do modelo para os casos acima em um planilha ((essa planilha pode ser feita no R como um ''​data.frame'',​ exportando depois como ''​csv''​));​ 
 +  * interprete o resultado ​do modelo ​biologicamente.
  
 </​WRAP>​ </​WRAP>​
Linha 531: Linha 550:
 ==== Tamanho e sobrepeso da mãe ==== ==== Tamanho e sobrepeso da mãe ====
  
-Um "outro especialista"​ ao analisar o modelo mínimo adequado selecionado acima afirmou que deveria incluir ​a variável ''​height''​ para controlar o peso do bebe ser maior apenas porque a mãe era grande. ​  Além disso sugeriu incluir uma nova variável que indicasse a quanto a gestante ​tem de sobrepeso ou subpeso. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como respotas ​e a variável altura como preditora. Todos os "​outros especialistas"​ concordaram que essa era uma boa sugestão, já que essa nova variável representa o quanto a gestante ​tem mais peso ou menos peso do que esperado para uma gestante ​com a sua altura.  ​+Um "outro especialista"​ao analisar o modelo mínimo adequado selecionado acimaafirmou que a variável ''​height'' ​deveria ser incluida ​para controlar o peso do bebê ser maior apenas porque a mãe era grande. ​  Além dissosugeriu incluir uma nova variável que indicasse a quanto a mãe tem de sobrepeso ou subpeso ​antes de engravidar. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como resposta ​e a variável altura como preditora. Todos os "​outros especialistas"​ concordaram que  ​eram ​uma boa sugestão, já que essa nova variável representa o quanto a mãe tem mais peso ou menos peso do que esperado para uma mãe com a mesma altura.  ​
    
 <WRAP center round box 80%> <WRAP center round box 80%>
Linha 540: Linha 559:
   * cronstrua um segundo modelo que inclua ''​resPeso''​ agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores;   * cronstrua um segundo modelo que inclua ''​resPeso''​ agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores;
   * compare os resumos de ambos os modelos e anote as diferenças encontradas;​   * compare os resumos de ambos os modelos e anote as diferenças encontradas;​
-  * no menu ''​Estatísticas''​ > ''​Resumos''​ > ''​Teste de correlação''​ selecione as variáveis ''​resPeso''​ e ''​weight'',​ anote o valor da correlação entre essas variáveis;+  * no menu ''​Estatísticas''​ > ''​Resumos''​ > ''​Teste de correlação''​ selecione as variáveis ''​resPeso''​ e ''​maeKg'',​ anote o valor da correlação entre essas variáveis;
 {{  :​cursos:​planeco:​roteiro:​corPeso.png?​700 ​ |}} {{  :​cursos:​planeco:​roteiro:​corPeso.png?​700 ​ |}}
   * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante;   * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante;
Linha 634: Linha 653:
 <WRAP center round help 90%> <WRAP center round help 90%>
  
-Responda o  [[https://​forms.gle/​qZg13LsMEG2xHRAe6|o formulário MLM III]] incluindo arquivos de resultados ​e figuras ​quando solicitado. ​+Responda o  [[https://​forms.gle/​wBbBoyssUMqSmurL8|o formulário MLM I]] incluindo arquivos de resultados quando solicitado. ​
  
  
Linha 705: Linha 724:
  
  
 +
 +/*
  
 ==== O que preciso entregar ==== ==== O que preciso entregar ====
Linha 719: Linha 740:
 {{url>​https://​forms.gle/​LvN2j8iE7JWpeEBr9}} {{url>​https://​forms.gle/​LvN2j8iE7JWpeEBr9}}
  
 +*/
cursos/planeco/roteiro/09-lm02.txt · Última modificação: 2024/03/25 13:51 (edição externa)