Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

--- cursos:planeco:roteiro:09-lm02 [2024/03/23 15:22]
127.0.0.1 edição externa
+++ cursos:planeco:roteiro:09-lm02 [2024/03/25 13:48]
127.0.0.1 edição externa
@@ Linha 61: / Linha 61: @@
-=====  Modelos Plausíves =====
+=====  Modelos Plausíveis =====
@@ Linha 85: / Linha 85: @@
 */
-==== Interação entre preditoras ====
-<WRAP center round box 80%>
-{{ youtube>Mx9skekN6e8 |}}
-</WRAP>
-Nos modelos acima, desconsideramos um elemento importante que emerge quanto temos mais de uma preditora, a possibilidade de uma variável preditora interferir no efeito de outra, efeito esse chamado de interação.
-A interação é um elemento muito importante quando temos mais de uma preditora, pois desconsiderá-la pode limitar o entendimento dos processos envolvidos. Um exemplo cotidiano da interação é visto no uso de medicamentos e o alerta da bula sobre interação medicamentosa ou efeitos colaterais para pessoas portadoras de doenças crônicas. Dizemos que um medicamento tem interação com outra substância quando o seu efeito é modificado pela presença de outra substância, como por exemplo a ingestão de álcool junto com muitos medicamentos. Nos modelos a interação tem uma interpretação similar, a resposta pelo efeito de uma variável preditora se altera com a presença de outra preditora. Muitas vezes a interação pode ser o efeito de interesse do estudo, como na pergunta: //O efeito de solo na produtividade agrícola  depende da quantidade de adubo orgânico adicionado?// Ou em outras palavras: //O efeito da adubação orgânica depende do tipo de solo?//  Note que nestas perguntas o foco não é se há ou não efeito do adubo ou solo, mas se a presença de uma variável afeta o efeito de outra.
-<WRAP center round todo 80%>
-  * No conjunto de modelos acima, não incluímos o termo da interação. Produza o modelo abaixo incluindo o termo da interação e avalie esse modelo e seus coeficientes.
-    ''prodCampo ~ solo + adubo + solo:adubo''
-</WRAP>
-Não é esperado encontrar interação entre as preditoras nos dados simulados da maneira como fizemos, ele pode emergir por acaso, apenas porque temos uma variável aleatória ((se o termo da interação foi significativo, confira os cálculos e mantenha o resultado como está, esse resultado emerge com baixa frequência, simplesmente por acaso. )). Da maneira como simulamos os dados temos duas preditoras que tem efeitos  aditivos onde não há interação. Uma outra forma de dizer isso é que o efeito do ''adubo'' não interfere no efeito do ''solo'', ou que esses efeitos são independentes. A interpretação biológica nesse caso também pode ser feita independentemente.
-======= Simulando dados com interação =======
-Seguindo a mesma abordagem anterior, vamos produzir dados simulando a interação entre as variáveis ''solo'' e ''adubo''. Para isso precisamos produzir dados em que o efeito do adubo depende do tipo de solo.
-  - Abra o arquivo {{ :cursos:planeco:roteiro:cropMult.xlsx |cropMulti}} em uma planilha eletrônica:
-<WRAP center round box 80%>
-{{ :cursos:planeco:roteiro:cropMult01.jpg?500 |  }}
-</WRAP>
-  - Preencha a coluna ''efeitoAdubo'' com os valores:
-    * 2.7 para ''arenoso'' com ''adubo'' igual a ''sim''
-    * 0.7 para ''argiloso'' com ''adubo'' igual a ''sim''
-    * 0.2 para ''humico'' com ''adubo'' igual a ''sim''
-  - O campos da coluna ''efeitoAdubo'' onde ''adubo'' é igual a ''não'' devem ser preenchidos com ''0''
-  - Preencha a célula ** E2** da coluna ''desvios normal'' com a fórmula //** = INV.NORM.N(ALEATÓRIO(); 0 ; 1.5)**//((Essa expressão retorna valores associados a uma distribuição normal com média 0 e desvio padrão 1.5. Para versões antigas do libreoffice a função pode ser '' = NORM.INV(RAND(), 0, 1.5)'')), as atuais utilizam a mesma que o excel.
-  - Some na coluna ''prodCampo'' os valores ''prodSolo + efeitoAdubo + desviosNormal''
-Ao final sua planilha deve estar preenchida como a que segue, apenas com os valores da coluna resíduo diferentes:
-<WRAP center round box 80%>
-{{ :cursos:planeco:roteiro:cropMult02.jpg?500 |}}
-</WRAP>
-<WRAP center round tip 80%>
-__**Procedimentos**__
-  - Salve a planilha com o nome ''soloAduboInteracao.csv'';
-  - Importe os dados para o Rcmdr. **Atenção nomeie os dados na aba de importação com o nome ''soloAduboInt'', em alguns casos o Rcmdr não importa se a planilha e os dados importados tiverem o mesmo nome de uma importação anterior**
-  - Confira se os dados foram lidos corretamente, inclusive se a decimal é ''.'';
-  - Produza o modelo cheio ''mlSolo_AduboAll'' com a seguinte formula:
-     * ''prodCampo ~ solo + adubo + solo:adubo''
-     * interprete o resumo, comparando com o resumo do modelo similar proveniente da planilha de dados anterior
-</WRAP>
 ===== Simplificando Modelos =====
@@ Linha 218: / Linha 151: @@
 </WRAP>
+</WRAP>
+<WRAP center round box 60%>
+  * compare os modelos plausíveis do tópico anterior;
+  * interprete o modelo mínimo adequado.
+</WRAP>
+==== Interação entre preditoras ====
+<WRAP center round box 80%>
+{{ youtube>Mx9skekN6e8 |}}
+</WRAP>
+Nos modelos acima, desconsideramos um elemento importante que emerge quanto temos mais de uma preditora, a possibilidade de uma variável preditora interferir no efeito de outra, efeito esse chamado de interação.
+A interação é um elemento muito importante quando temos mais de uma preditora, pois desconsiderá-la pode limitar o entendimento dos processos envolvidos. Um exemplo cotidiano da interação é visto no uso de medicamentos e o alerta da bula sobre interação medicamentosa ou efeitos colaterais para pessoas portadoras de doenças crônicas. Dizemos que um medicamento tem interação com outra substância quando o seu efeito é modificado pela presença de outra substância, como por exemplo a ingestão de álcool junto com muitos medicamentos. Nos modelos a interação tem uma interpretação similar, a resposta pelo efeito de uma variável preditora se altera com a presença de outra preditora. Muitas vezes a interação pode ser o efeito de interesse do estudo, como na pergunta: //O efeito de solo na produtividade agrícola  depende da quantidade de adubo orgânico adicionado?// Ou em outras palavras: //O efeito da adubação orgânica depende do tipo de solo?//  Note que nestas perguntas o foco não é se há ou não efeito do adubo ou solo, mas se a presença de uma variável afeta o efeito de outra.
+<WRAP center round todo 80%>
+  * No conjunto de modelos acima, não incluímos o termo da interação. Produza o modelo abaixo incluindo o termo da interação e avalie esse modelo e seus coeficientes.
+    ''prodCampo ~ solo + adubo + solo:adubo''
+</WRAP>
+Não é esperado encontrar interação entre as preditoras nos dados simulados da maneira como fizemos, ele pode emergir por acaso, apenas porque temos uma variável aleatória ((se o termo da interação foi significativo, confira os cálculos e mantenha o resultado como está, esse resultado emerge com baixa frequência, simplesmente por acaso. )). Da maneira como simulamos os dados temos duas preditoras que tem efeitos  aditivos onde não há interação. Uma outra forma de dizer isso é que o efeito do ''adubo'' não interfere no efeito do ''solo'', ou que esses efeitos são independentes. A interpretação biológica nesse caso também pode ser feita independentemente.
+======= Simulando dados com interação =======
+Seguindo a mesma abordagem anterior, vamos produzir dados simulando a interação entre as variáveis ''solo'' e ''adubo''. Para isso precisamos produzir dados em que o efeito do adubo depende do tipo de solo.
+  - Abra o arquivo {{ :cursos:planeco:roteiro:cropMult.xlsx |cropMulti}} em uma planilha eletrônica:
+<WRAP center round box 80%>
+{{ :cursos:planeco:roteiro:cropMult01.jpg?500 |  }}
+</WRAP>
+  - Preencha a coluna ''efeitoAdubo'' com os valores:
+    * 2.7 para ''arenoso'' com ''adubo'' igual a ''sim''
+    * 0.7 para ''argiloso'' com ''adubo'' igual a ''sim''
+    * 0.2 para ''humico'' com ''adubo'' igual a ''sim''
+  - O campos da coluna ''efeitoAdubo'' onde ''adubo'' é igual a ''não'' devem ser preenchidos com ''0''
+  - Preencha a célula ** E2** da coluna ''desvios normal'' com a fórmula //** = INV.NORM.N(ALEATÓRIO(); 0 ; 1.5)**//((Essa expressão retorna valores associados a uma distribuição normal com média 0 e desvio padrão 1.5. Para versões antigas do libreoffice a função pode ser '' = NORM.INV(RAND(), 0, 1.5)'')), as atuais utilizam a mesma que o excel.
+  - Some na coluna ''prodCampo'' os valores ''prodSolo + efeitoAdubo + desviosNormal''
+Ao final sua planilha deve estar preenchida como a que segue, apenas com os valores da coluna resíduo diferentes:
+<WRAP center round box 80%>
+{{ :cursos:planeco:roteiro:cropMult02.jpg?500 |}}
+</WRAP>
+<WRAP center round tip 80%>
+__**Procedimentos**__
+  - Salve a planilha com o nome ''soloAduboInteracao.csv'';
+  - Importe os dados para o Rcmdr. **Atenção nomeie os dados na aba de importação com o nome ''soloAduboInt'', em alguns casos o Rcmdr não importa se a planilha e os dados importados tiverem o mesmo nome de uma importação anterior**
+  - Confira se os dados foram lidos corretamente, inclusive se a decimal é ''.'';
+  - Produza o modelo cheio ''mlSolo_AduboAll'' com a seguinte formula:
+     * ''prodCampo ~ solo + adubo + solo:adubo''
+     * interprete o resumo, comparando com o resumo do modelo similar proveniente da planilha de dados anterior
 </WRAP>
@@ Linha 392: / Linha 397: @@
 No menu ''Estatísticas > Ajustes de modelos > Modelo linear...'', construa o modelo ''lmFull'' com todas as quatro preditoras ((''gestation'', ''age'', ''maeKg'' e ''smoke'')) e suas interações. O modelo resultante tem a seguinte expressão:
-<code> pesoKg ~ age * gestation * maeKg * smoke</code>
+<code> bebeKg ~ age * gestation * maeKg * smoke</code>
 Na linguagem R os símbolos de ''*'' em expressões de notação de modelos representa tanto a variável isoladamente quanto as interações possíveis.
@@ Linha 414: / Linha 419: @@
 === Combinatória ===
-Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos 5 variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:
+Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos 4 variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é:
 $$C^{r}_{n} =  \frac{n!}{r! (n-r)!} $$
@@ Linha 448: / Linha 453: @@
   * ''gestation:maeKg''
   * ''gestation:smoke''
-  * ''height:smoke''
+  * ''maeKg:smoke''
 Além dessas, temos os termos isolados para cada variável e o intercepto do modelo, totalizando os 16 termos do modelo ''lmFull''.
@@ Linha 469: / Linha 474: @@
   * Produza o modelo nulo chamado ''lmNull'' com a formula:
-      * ''pesoKg ~ 1''
+      * ''bebeKg ~ 1''
   * compare com o modelo cheio produzido acima ''lmFull'' utilizando a função:
       * ''anova(lmNull, lmFull)''
@@ Linha 501: / Linha 506: @@
 Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações), podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "muita" experiência sobre tamanhos de bebês ao nascer, "consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são:
- ''pesoKg ~ gestation + age + weight + smoke + gestation:age + gestation:smoke +
+ ''bebeKg ~ gestation + age + maeKg + smoke + gestation:age + gestation:smoke +
-            age:weight + age:smoke + weight:smoke + gestation:age:smoke ''
+            age:maeKg + age:smoke + maeKg:smoke + gestation:age:smoke ''
 <WRAP center round box 80%>
 ==== Seleção do mínimo adequado ====
@@ Linha 511: / Linha 517: @@
-<code> bwt ~ gestation + age + weight + smoke +
+<code> bebeKg ~ gestation + age + maeKg + smoke +
             gestation:age + gestation:smoke +
-            age:weight + age:smoke + weight:smoke +
+            age:maeKg + age:smoke + maeKg:smoke +
             gestation:age:smoke
 </code>
   * simplifique esse modelo até o mínimo adequado;
 <WRAP center round tip 80%>
 Durante o processo de simplificação, quando nos defrontamos com vários termos de mesma ordem não significativos, um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos, ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo" em um modelo mais complexo pode se tornar "significativo" em um modelo mais simples.
 </WRAP>
-  * interprete o resultado do modelo mínimo adequado com relação aos termos selecionados;
+  * qual a predição do modelo selecionado do peso do bebê das seguintes mães:
-  * qual a predição do modelo selecionado do peso do bebê de uma mãe de 30 anos, que teve uma gestação de 280 dias e peso de 125 pounds
+      * 26 anos, 280 dias de gestação, peso 55 kg e não fumante
-  * interprete o resultado biologicamente.
+      * 26 anos, 280 dias de gestação, peso 55 kg e fumante
+      * 26 anos, 210 dias de gestação, peso 55 kg e não fumante
+      * 26 anos, 210 dias de gestação, peso 55 kg e fumante
+      * 26 anos, 280 dias de gestação, peso 70 kg e não fumante
+      * 26 anos, 280 dias de gestação, peso 70 kg e fumante
+      * 26 anos, 210 dias de gestação, peso 70 kg e não fumante
+      * 26 anos, 210 dias de gestação, peso 70 kg e fumante
+  * faça as mesmas predições acima, agora para uma mãe com 35 anos;
+  * coloque as características da mãe e as predições do modelo para os casos acima em um planilha ((essa planilha pode ser feita no R como um ''data.frame'', exportando depois como ''csv''));
+  * interprete o resultado do modelo biologicamente.
 </WRAP>
@@ Linha 531: / Linha 550: @@
 ==== Tamanho e sobrepeso da mãe ====
-Um "outro especialista" ao analisar o modelo mínimo adequado selecionado acima afirmou que deveria incluir a variável ''height'' para controlar o peso do bebe ser maior apenas porque a mãe era grande.   Além disso sugeriu incluir uma nova variável que indicasse a quanto a gestante tem de sobrepeso ou subpeso. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como respotas e a variável altura como preditora. Todos os "outros especialistas" concordaram que essa era uma boa sugestão, já que essa nova variável representa o quanto a gestante tem mais peso ou menos peso do que esperado para uma gestante com a sua altura.
+Um "outro especialista", ao analisar o modelo mínimo adequado selecionado acima, afirmou que a variável ''height'' deveria ser incluida para controlar o peso do bebê ser maior apenas porque a mãe era grande.   Além disso, sugeriu incluir uma nova variável que indicasse a quanto a mãe tem de sobrepeso ou subpeso antes de engravidar. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como resposta e a variável altura como preditora. Todos os "outros especialistas" concordaram que  eram uma boa sugestão, já que essa nova variável representa o quanto a mãe tem mais peso ou menos peso do que esperado para uma mãe com a mesma altura.
 <WRAP center round box 80%>
@@ Linha 540: / Linha 559: @@
   * cronstrua um segundo modelo que inclua ''resPeso'' agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores;
   * compare os resumos de ambos os modelos e anote as diferenças encontradas;
-  * no menu ''Estatísticas'' > ''Resumos'' > ''Teste de correlação'' selecione as variáveis ''resPeso'' e ''weight'', anote o valor da correlação entre essas variáveis;
+  * no menu ''Estatísticas'' > ''Resumos'' > ''Teste de correlação'' selecione as variáveis ''resPeso'' e ''maeKg'', anote o valor da correlação entre essas variáveis;
 {{  :cursos:planeco:roteiro:corPeso.png?700  |}}
   * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante;
@@ Linha 634: / Linha 653: @@
 <WRAP center round help 90%>
-Responda o  [[https://forms.gle/qZg13LsMEG2xHRAe6|o formulário MLM III]] incluindo arquivos de resultados e figuras quando solicitado.
+Responda o  [[https://forms.gle/wBbBoyssUMqSmurL8|o formulário MLM I]] incluindo arquivos de resultados quando solicitado.
@@ Linha 705: / Linha 724: @@
+/*
 ==== O que preciso entregar ====
@@ Linha 719: / Linha 740: @@
 {{url>https://forms.gle/LvN2j8iE7JWpeEBr9}}
+*/

Laboratório de Ecologia de Florestas Tropicais

Ferramentas do usuário

Ferramentas do site

Diferenças

Ferramentas da página