Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:09-lm02b

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
Última revisão Ambos lados da revisão seguinte
cursos:planeco:roteiro:09-lm02b [2022/04/15 14:20]
adriana
cursos:planeco:roteiro:09-lm02b [2022/04/15 16:10]
adriana [Biomassa de manguezais e variáveis ambientais]
Linha 47: Linha 47:
  
 Vamos ver como isso funciona na prática abaixo. Vamos ver como isso funciona na prática abaixo.
 +\\
  
  
Linha 54: Linha 55:
 \\ \\
  
-O objetivo dessa pesquisa foi avaliar quais variáveis ​climáticas ​predizem melhor a riqueza ​de aves em diferentes locais do mundo. Foram utilizadas ​variáveis ​climáticas ​que são facilmente obtidas em bases de dados mundiais ​sobre clima +O objetivo dessa pesquisa foi avaliar quais variáveis ​ambientais ​predizem melhor a biomassa acima do solo (Aboveground Biomass-AGB) ​de manguezais ​em diferentes locais do mundo((dados fictícios, mas baseados em valores reais)). Foram utilizadas ​variáveis ​ambientais ​que são facilmente obtidas em bases de dados mundiais.
- +
-\\+
 \\ \\
  
- +1. Baixe o conjunto de dados {{ :​cursos:​planeco:​roteiro:​mangrove.csv |mangrove.csv}}, importe para o Rcmdr, usando __vírgula__ como separador de campo, e visualize os dados para entender o arquivo.
- +
-1. Baixe o conjunto de dados {{ :​cursos:​planeco:​roteiro:​birds_clim.csv |}} ((adaptado do conjunto de dados "​Sa"​ disponível na página da disciplina ECP00117 - Introdução aos Modelos Lineares em Ecologia, da UFG - link: https://​www.ecoevol.ufg.br/​adrimelo/​lm/​)), importe para o Rcmdr, usando __vírgula__ como separador de campo, e visualize os dados para entender o arquivo.+
  
 2. Entenda as variáveis do arquivo:  ​ 2. Entenda as variáveis do arquivo:  ​
-  * variável resposta: ​ **TotalBirdsRichness** = Riqueza ((Conforme veremos no próximo bloco de atividades, essa variável resposta deveria ser analisada utilizando um modelo linear generalizado GLM, mas nesse momento pedimos uma "​licença didática"​ para utilizarmos modelos lineares múltiplos. Recomendamos que depois vocês refaçam essa análise usando um GLM adequado.)) total de aves registradas ​no local+  * variável resposta: ​ 
 +             * **AGB_carbon** = Estoque ​de Carbono estimado a partir da biomassa acima do solo (AGB) de árvores de manguezais (MgC/​ha) ​no hemisfério sul
   * variáveis preditoras:   * variáveis preditoras:
-             * **AET** = evapotranspiração real +             * **lat** = latitude ​(em graus)((Os dados são predominantemente do hemisfério sul e por isso seriam esperados valores negativos de latitude, porém foram transformados em valores positivos para facilitar a interpretação. Alguns valores do hemisfério norte aparecem como negativos na planilha))  
-             * **PET** = evapotranspiração potencial +             * **temp** = Temperatura média ​anual (em graus Celsius
-             * **AnnualTemperature** = Temperatura média anual (em Farenheit+             * **ppt** = Precipitação anual (mm)
-             * **MinimumTemperature** = Temperatura média ​mínima ​(em Farenheit+
-             * **Rain** = Precipitação anual (mm) +
  
  
 3. Inspecione a correlação entre todas as variáveis preditoras contínuas: 3. Inspecione a correlação entre todas as variáveis preditoras contínuas:
  
-Para fazer isso, você tem duas opções ​no Rcmdr: +Para fazer isso no R Commander, você tem duas opções:
- +
-  * Uma opção é avaliar numericamente as correlações. Para isso, entre em **Estatísticas->​ Resumos -> Matriz de Correlação**,​ selecione todas as variáveis preditoras contínuas e clique em OK. Você verá os valores de correlação de todos os pares de variáveis. Observando os valores mais altos de correlação,​ você já pode ter uma ideia se existem variáveis com potencial para apresentar colinearidade. ​+
  
 +  * Uma opção é avaliar numericamente as correlações. Para isso, entre em **Estatísticas->​ Resumos -> Matriz de Correlação**,​ selecione todas as variáveis preditoras e clique em OK. Você verá os valores de correlação de todos os pares de variáveis. Observando os valores mais altos de correlação,​ você já pode ter uma ideia se existem variáveis com potencial para apresentar colinearidade. ​
  
   * Outra opção é avaliar graficamente as correlações entre as variáveis. Para isso, entre em **Gráficos -> Matriz de Dispersão** e selecione todas as variáveis preditoras contínuas. Na aba **Opções** selecione "​Linhas de quadrados mínimos"​ e clique em OK. Na figura que foi gerada, você poderá avaliar quais pares de variáveis parecem ter uma maior correlação entre elas.   * Outra opção é avaliar graficamente as correlações entre as variáveis. Para isso, entre em **Gráficos -> Matriz de Dispersão** e selecione todas as variáveis preditoras contínuas. Na aba **Opções** selecione "​Linhas de quadrados mínimos"​ e clique em OK. Na figura que foi gerada, você poderá avaliar quais pares de variáveis parecem ter uma maior correlação entre elas.
  
-<WRAP center round important ​80%>+<WRAP center round important ​90%>
 Esse procedimento de analisar a correlação entre todas as nossas variáveis preditoras contínuas deveria ser sempre realizado antes de fazermos nossas análises. ​ Esse procedimento de analisar a correlação entre todas as nossas variáveis preditoras contínuas deveria ser sempre realizado antes de fazermos nossas análises. ​
 </​WRAP>​ </​WRAP>​
  
  
-4. Ajuste um modelo ​incluindo ​todas as variáveis ​e coloque "​modbird1"​ como nome do modelo. Neste momento não inclua ​as interações. No resumo ​do modelo, repare nos efeitos e na significância de cada um dos parâmetros.+4. Ajuste um modelo, relacionando AGB-carbon com todas as variáveis ​preditoras, mas ainda sem incluir ​as interações. Nomeie esse modelo como "​carbon1"​. No //​summary// ​do modelo, repare nos efeitos e na significância de cada um dos parâmetros.
  
  
-5. Calcule os VIFs para as variáveis incluídas no modelo+5. Calcule os VIFs((A função utilizada no R Commander para calcular o ''​VIF''​ utiliza uma variante chamada ''​GVIF'',​ uma generalização que pode ser aplicada também para variáveis categóricas com a mesma interpretação colocada acima o ''​GVIF''​ foi desenvolvida pelo John Fox, mesmo autor do Rcmdr. Veja o artigo no link [[https://​www.tandfonline.com/​doi/​abs/​10.1080/​01621459.1992.10475190]])) ​para as variáveis incluídas no modelo
  
 Para isso, entre em **Modelos -> Diagnóstico numérico -> Fatores de Inflação de Variância**. Para isso, entre em **Modelos -> Diagnóstico numérico -> Fatores de Inflação de Variância**.
 O primeiro resultado apresentado é uma linha com os valores de VIF para cada parâmetro do modelo. O segundo resultado apresentado é uma matriz de correlação das __estimativas dos parâmetros__. Note que os valores são diferentes das correlações feitas diretamente para as variáveis (item 3, acima). O primeiro resultado apresentado é uma linha com os valores de VIF para cada parâmetro do modelo. O segundo resultado apresentado é uma matriz de correlação das __estimativas dos parâmetros__. Note que os valores são diferentes das correlações feitas diretamente para as variáveis (item 3, acima).
  
-<WRAP center round important ​80%> +<WRAP center round important ​90%> 
-Importante: Como o valor de VIF de cada parâmetro depende de quais outros parâmetros estão sendo incluídos no modelo, só é possível calcular os VIFs depois de ter ajustado um modelo. ​Fique sempre atento(a) se o modelo ativo é o modelo para o qual você quer calcular os VIFs.+Importante: Como o valor de VIF de cada parâmetro depende de quais outros parâmetros estão sendo incluídos no modelo, só é possível calcular os VIFs depois de ter ajustado um modelo. ​Ao usar o R Commander, fique sempre atento(a) se o modelo ativo é realmente ​o modelo para o qual você quer calcular os VIFs.
 </​WRAP>​ </​WRAP>​
  
-A função que utilizaremos no R para calcular o ''​VIF''​ utiliza uma variante chamada ''​GVIF'',​ uma generalização que pode ser aplicada também para variáveis categóricas com a mesma interpretação colocada acima((o ''​GVIF''​ foi desenvolvida pelo John Fox, mesmo autor do Rcmdr. Veja o artigo no link [[https://​www.tandfonline.com/​doi/​abs/​10.1080/​01621459.1992.10475190]])).  ​ 
  
 +<WRAP center round box 70%>
  
-6. Pausa para checar ​os valores ​dos VIFs:+**PAUSA OPCIONAL** caso você queira aprender a calcular manualmente ​os valores ​de VIF:
  
-Vamos agora checar se está claro como o VIF é calculado. ​Em primeiro lugar, reveja a equação de cálculo de VIF apresentada acima.+Em primeiro lugar, reveja a equação de cálculo de VIF apresentada acima.
  
-Vamos calcular manualmente o valor de VIF para uma variável preditora e comparar com o valor obtido acima no Rcmdr. Para isso, precisamos calcular o R<​sup>​2</​sup>​ da relação entre essa variável preditora e todas as outras preditoras que estavam ​nesse modelo ("​modbird1"​). Para isso, essa variável ​preditora na qual estamos interessados em calcular o VIF (especificamente para esse modelo completo) passará agora a ser a variável resposta de um novo modelo que criaremos. ​Então, vamos fazer isso para a variável AET:+Agora, vamos calcular manualmente o valor de VIF para variável preditora ​**lat** ​e comparar com o valor obtido acima no R Commander. Para isso, precisamos calcular o R<​sup>​2</​sup>​ da relação entre essa variável preditora e todas as outras preditoras que estavam ​no modelo ​completo, sem as interações ​(carbon1). Para isso, vamos criar um novo modelo no qual a variável ​para a qual estamos interessados em calcular o VIF (**lat**) passará agora a ser a __variável resposta__ desse novo modelo que criaremos. ​
  
-Entre em **Estatísticas -> Ajuste de Modelos -> Modelo Linear**. Coloque ​AET como variável resposta ​na caixa da esquerda da equação e coloque as outras ​variáveis preditoras na caixa da direita da equação. Defina o nome desse modelo como "vif_aet". No resumo ​do modelo será apresentado ​um valor de R<​sup>​2</​sup>​ Múltiplo (//Multiple R-square//​). Utilize esse valor na equação de cálculo de VIF e veja se o resultado é igual ao valor de VIF calculado pelo Rcmdr. Deveria ser. Se não foi, peça ajuda a alguém da equipe.+Entre em **Estatísticas -> Ajuste de Modelos -> Modelo Linear**. Coloque ​**lat** ​como __variável resposta__ ​na caixa da esquerda da equação e coloque as outras ​variáveis preditoras ​(**temp** + **ppt**) ​na caixa da direita da equação. Defina o nome desse modelo como "viflat". No //​summary// ​do modelo será apresentado ​valor de R<​sup>​2</​sup>​ Múltiplo (//Multiple R-square//​). Utilize esse valor na equação de cálculo de VIF e veja se o resultado é igual ao valor de VIF calculado pelo R Commander para a variável **lat** a partir do modelo "​carbon1"​ feito acima. Deveria ser. Se não foi, peça ajuda a alguém da equipe.
  
 Repita o mesmo procedimento para outra variável de sua escolha. Você pode fazer isso para todas as variáveis do modelo, se quiser. Repita o mesmo procedimento para outra variável de sua escolha. Você pode fazer isso para todas as variáveis do modelo, se quiser.
  
 +</​WRAP>​
  
 +Continuando nossa análise sobre o estoque de Carbono em manguezais:
  
-7**Continuando nossa análise:** Analisando o resultado ​dos VIFs, se houver alguma variável com valor maior que 4, ajuste um novo modelo no qual a variável com o maior VIF seja removida. Coloque "modbird2" como nome desse modelo. Olhe para o //summary// desse modelo e para as variáveis que permaneceram nele. Cheque os valores dos coeficientes e a significância de cada variável em relação ao modelo "modbird1". Houve alguma alteração?​ Alguma variável deixou de ser significativa?​ Alguma variável passou a ser significativa?​ O sinal do efeito mudou? ​ +6Após analisar os valores ​dos VIFs do modelo "​carbon1"​, se houver alguma variável com valor maior que 4, remova ​a variável com o maior VIF e ajuste um novo modelo. Coloque "carbon2" como nome desse modelo. Olhe para o //summary// desse modelo e para as variáveis que permaneceram nele. Cheque os valores dos coeficientes e a significância de cada variável em relação ao modelo "carbon1"​. ​**Houve alguma alteração?​ Alguma variável deixou de ser significativa?​ Alguma variável passou a ser significativa?​ O sinal do efeito mudou?** 
-Depois, calcule os VIFs das variáveis do "​modbird2"​ e veja se ainda tem alguma variável com VIF maior que 4.+
  
-8Repita esses procedimentos até não haver nenhuma ​variável com VIF maior que 4.+7Calcule os VIFs das variáveis do modelo "​carbon2"​ usando o caminho **Modelos -> Diagnóstico numérico -> Fatores de Inflação de Variância** e veja se ainda tem alguma ​variável com VIF maior que 4.
  
-9Mesmo sem ter variáveis colineares, é possível que algumas das variáveis remanescentes ​não sejam relevantes para definir o número de espécies de aves. Então, agora, crie um modelo completo, ​que inclua as variáveis remanescentes e suas interações e realize o procedimento de seleção do modelo mínimo plausível pelo método de simplificação para o mínimo adequado, conforme explicado no roteiro I de MLM.+8Repita os procedimentos anteriores até não haver nenhuma variável com VIF maior que 4.
  
-10. Analise ​os resultados ​do modelo ​final.+9. E possível que algumas das variáveis remanescentes,​ mesmo que não sejam colineares entre si, não sejam relevantes para definir o estoque de carbono em manguezais. Então, para iniciar o procedimento de seleção de modelos, crie um modelo completo ​ que inclua as variáveis remanescentes **e suas interações** (nomeie como "​carbon_int"​). Analise ​o //summary//do modelo.
  
 +10. Realize o procedimento de seleção do modelo mínimo plausível pelo método de simplificação para o mínimo adequado, conforme explicado no item [[cursos:​planeco:​roteiro:​09-lm02#​simplificando_modelos|Simplificando modelos]] do roteiro I de Modelos Lineares Múltiplos]] ​
  
-===== Modelos Lineares Múltiplos: preditoras contínuas e categóricas =====+11. Analise os resultados do modelo final. 
 +\\ 
 +\\ 
 +\\
  
-{{:​cursos:​planeco:​roteiro:​plotBabies01.png?​400 ​ |}} 
  
  
-Nesse último tópico do bloco vamos resgatar os principais conceitos que emergiram com a generalização do modelo linear, agora com múltiplas preditoras, a partir de um exemplo que tem duas variáveis ​preditoras contínuas e duas categórica. Acreditamos que esse exemplo incorpora as complexidades tratadas e ajuda a agrupar os tópicos que devem ficar atentos nos modelos com múltiplas preditoras. ​    +===== Modelos Lineares Múltiplos: ​preditoras contínuas e categóricas =====
  
 +{{:​cursos:​planeco:​roteiro:​plotBabies01.png?​300 ​ |}}
 +
 +\\
 +\\
 +\\
 +\\
 +Nesse último tópico do bloco vamos resgatar os principais conceitos que emergiram com a generalização do modelo linear, agora com múltiplas preditoras, a partir de um exemplo que tem duas variáveis preditoras contínuas e duas categórica. Acreditamos que esse exemplo incorpora as complexidades tratadas e ajuda a agrupar os tópicos que devem ficar atentos nos modelos com múltiplas preditoras. ​    
 +\\
 +\\
 +\\ 
 +\\
 +\\
 +\\
 +\\
  
 <WRAP center round box 60%> <WRAP center round box 60%>
Linha 149: Linha 161:
   * compreender os termos de interação;​   * compreender os termos de interação;​
   * compor o predito pelo modelo a partir dos coeficientes;​   * compor o predito pelo modelo a partir dos coeficientes;​
-  * interpretar ​biológicamente ​o resultado do modelo.+  * interpretar ​biologicamente ​o resultado do modelo.
  
  
 </​WRAP>​ </​WRAP>​
 +\\
 +\\
  
 ==== VIF e as interações ==== ==== VIF e as interações ====
cursos/planeco/roteiro/09-lm02b.txt · Última modificação: 2022/04/15 17:03 por adriana