Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:09-lm02b

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
cursos:planeco:roteiro:09-lm02b [2022/04/15 14:46]
adriana [Biomassa de manguezais e variáveis ambientais]
cursos:planeco:roteiro:09-lm02b [2022/04/15 17:03]
adriana
Linha 71: Linha 71:
 3. Inspecione a correlação entre todas as variáveis preditoras contínuas: 3. Inspecione a correlação entre todas as variáveis preditoras contínuas:
  
-Para fazer isso no R Commander, você tem duas opções:+Para fazer isso no //Rcmdr//, você tem duas opções:
  
-  * Uma opção é avaliar numericamente as correlações. Para isso, entre em **Estatísticas-> Resumos ​-> Matriz de Correlação**, selecione todas as variáveis preditoras e clique em OK. Você verá os valores de correlação de todos os pares de variáveis. Observando os valores mais altos de correlação,​ você já pode ter uma ideia se existem variáveis com potencial para apresentar colinearidade. ​+  * Uma opção é avaliar numericamente as correlações. Para isso, entre em **Statistics-> Summary ​-> Correlation Matrix**, selecione todas as variáveis preditoras e clique em OK. Você verá os valores de correlação de todos os pares de variáveis. Observando os valores mais altos de correlação,​ você já pode ter uma ideia se existem variáveis com potencial para apresentar colinearidade. ​
  
-  * Outra opção é avaliar graficamente as correlações entre as variáveis. Para isso, entre em **Gráficos ​-> Matriz de Dispersão** e selecione todas as variáveis preditoras contínuas. Na aba **Opções** selecione "Linhas de quadrados mínimos" e clique em OK. Na figura que foi gerada, você poderá avaliar quais pares de variáveis parecem ter uma maior correlação entre elas.+  * Outra opção é avaliar graficamente as correlações entre as variáveis. Para isso, entre em **Graphics ​-> Dispersion Matrix** e selecione todas as variáveis preditoras contínuas. Na aba **Options** selecione "Minimum Square Line" e clique em OK. Na figura que foi gerada, você poderá avaliar quais pares de variáveis parecem ter uma maior correlação entre elas.
  
-<WRAP center round important ​80%>+<WRAP center round important ​90%>
 Esse procedimento de analisar a correlação entre todas as nossas variáveis preditoras contínuas deveria ser sempre realizado antes de fazermos nossas análises. ​ Esse procedimento de analisar a correlação entre todas as nossas variáveis preditoras contínuas deveria ser sempre realizado antes de fazermos nossas análises. ​
 </​WRAP>​ </​WRAP>​
  
  
-4. Ajuste um modelo relacionando AGB-carbon com todas as variáveis preditoras, mas ainda sem incluir as interações. No resumo ​do modelo, repare nos efeitos e na significância de cada um dos parâmetros.+4. Ajuste um modelorelacionando AGB-carbon com todas as variáveis preditoras, mas ainda sem incluir as interações. Nomeie esse modelo como "​carbon1"​. No //​summary// ​do modelo, repare nos efeitos e na significância de cada um dos parâmetros.
  
  
-5. Calcule os VIFs((A função utilizada no R Commander ​para calcular o ''​VIF''​ utiliza uma variante chamada ''​GVIF'',​ uma generalização que pode ser aplicada também para variáveis categóricas com a mesma interpretação colocada acima((o ''​GVIF''​ foi desenvolvida pelo John Fox, mesmo autor do Rcmdr. Veja o artigo no link [[https://​www.tandfonline.com/​doi/​abs/​10.1080/​01621459.1992.10475190]])). )) para as variáveis incluídas no modelo+5. Calcule os VIFs((A função utilizada no //​Rcmdr// ​para calcular o ''​VIF''​ utiliza uma variante chamada ''​GVIF'',​ uma generalização que pode ser aplicada também para variáveis categóricas com a mesma interpretação colocada acima o ''​GVIF''​ foi desenvolvida pelo John Fox, mesmo autor do Rcmdr. Veja o artigo no link [[https://​www.tandfonline.com/​doi/​abs/​10.1080/​01621459.1992.10475190]])) para as variáveis incluídas no modelo
  
-Para isso, entre em **Modelos ​-> Diagnóstico numérico ​-> Fatores de Inflação de Variância**. +Para isso, entre em **Models ​-> Numerical diagnostics ​-> Variance-inflation factors**. O primeiro resultado apresentado é uma linha com os valores de VIF para cada parâmetro do modelo. O segundo resultado apresentado é uma matriz de correlação das __estimativas dos parâmetros__. Note que os valores são diferentes das correlações feitas diretamente para as variáveis (item 3, acima).
-O primeiro resultado apresentado é uma linha com os valores de VIF para cada parâmetro do modelo. O segundo resultado apresentado é uma matriz de correlação das __estimativas dos parâmetros__. Note que os valores são diferentes das correlações feitas diretamente para as variáveis (item 3, acima).+
  
-<WRAP center round important ​80%> +<WRAP center round important ​90%> 
-Importante: Como o valor de VIF de cada parâmetro depende de quais outros parâmetros estão sendo incluídos no modelo, só é possível calcular os VIFs depois de ter ajustado um modelo. Ao usar o R Commander, fique sempre atento(a) se o modelo ativo é o modelo para o qual você quer calcular os VIFs.+Importante: Como o valor de VIF de cada parâmetro depende de quais outros parâmetros estão sendo incluídos no modelo, só é possível calcular os VIFs depois de ter ajustado um modelo. Ao usar o //Rcmdr//, fique sempre atento(a) se o modelo ativo é realmente ​o modelo para o qual você quer calcular os VIFs.
 </​WRAP>​ </​WRAP>​
  
  
 +<WRAP center round box 70%>
  
-6. Pausa para checar ​os valores ​dos VIFs:+**PAUSA OPCIONAL** caso você queira aprender a calcular manualmente ​os valores ​de VIF:
  
-Vamos agora checar se está claro como o VIF é calculado. ​Em primeiro lugar, reveja a equação de cálculo de VIF apresentada acima.+Em primeiro lugar, reveja a equação de cálculo de VIF apresentada acima.
  
-Vamos calcular manualmente o valor de VIF para uma variável preditora e comparar com o valor obtido acima no Rcmdr. Para isso, precisamos calcular o R<​sup>​2</​sup>​ da relação entre essa variável preditora e todas as outras preditoras que estavam ​nesse modelo ("​modbird1"​). Para isso, essa variável ​preditora na qual estamos interessados em calcular o VIF (especificamente para esse modelo completo) passará agora a ser a variável resposta de um novo modelo que criaremos. ​Então, vamos fazer isso para a variável AET:+Agora, vamos calcular manualmente o valor de VIF para variável preditora ​**lat** ​e comparar com o valor obtido acima no //Rcmdr//. Para isso, precisamos calcular o R<​sup>​2</​sup>​ da relação entre essa variável preditora e todas as outras preditoras que estavam ​no modelo ​completo, sem as interações ​(carbon1). Para isso, vamos criar um novo modelo no qual a variável ​para a qual estamos interessados em calcular o VIF (**lat**) passará agora a ser a __variável resposta__ desse novo modelo que criaremos. ​
  
-Entre em **Estatísticas ​-> Ajuste de Modelos ​-> Modelo ​Linear**. Coloque ​AET como variável resposta ​na caixa da esquerda da equação e coloque as outras ​variáveis preditoras na caixa da direita da equação. Defina o nome desse modelo como "vif_aet". No resumo ​do modelo será apresentado ​um valor de R<​sup>​2</​sup>​ Múltiplo (//Multiple R-square//​). Utilize esse valor na equação de cálculo de VIF e veja se o resultado é igual ao valor de VIF calculado pelo Rcmdr. Deveria ser. Se não foi, peça ajuda a alguém da equipe.+Entre em **Statistics ​-> Fit models ​-> Linear ​model**. Coloque ​**lat** ​como __variável resposta__ ​na caixa da esquerda da equação e coloque as outras ​variáveis preditoras ​(**temp** + **ppt**) ​na caixa da direita da equação. Defina o nome desse modelo como "viflat". No //​summary// ​do modelo será apresentado ​valor de R<​sup>​2</​sup>​ Múltiplo (//Multiple R-square//​). Utilize esse valor na equação de cálculo de VIF e veja se o resultado é igual ao valor de VIF calculado pelo R Commander para a variável **lat** a partir do modelo "​carbon1"​ feito acima. Deveria ser. Se não foi, peça ajuda a alguém da equipe.
  
 Repita o mesmo procedimento para outra variável de sua escolha. Você pode fazer isso para todas as variáveis do modelo, se quiser. Repita o mesmo procedimento para outra variável de sua escolha. Você pode fazer isso para todas as variáveis do modelo, se quiser.
  
 +</​WRAP>​
  
 +Continuando nossa análise sobre o estoque de Carbono em manguezais:
  
-7**Continuando nossa análise:** Analisando o resultado ​dos VIFs, se houver alguma variável com valor maior que 4, ajuste um novo modelo no qual a variável com o maior VIF seja removida. Coloque "modbird2" como nome desse modelo. Olhe para o //summary// desse modelo e para as variáveis que permaneceram nele. Cheque os valores dos coeficientes e a significância de cada variável em relação ao modelo "modbird1". Houve alguma alteração?​ Alguma variável deixou de ser significativa?​ Alguma variável passou a ser significativa?​ O sinal do efeito mudou? ​ +6Após analisar os valores ​dos VIFs do modelo "​carbon1"​, se houver alguma variável com valor maior que 4, remova ​a variável com o maior VIF e ajuste um novo modelo. Coloque "carbon2" como nome desse modelo. Olhe para o //summary// desse modelo e para as variáveis que permaneceram nele. Cheque os valores dos coeficientes e a significância de cada variável em relação ao modelo "carbon1"​. ​**Houve alguma alteração?​ Alguma variável deixou de ser significativa?​ Alguma variável passou a ser significativa?​ O sinal do efeito mudou?** 
-Depois, calcule os VIFs das variáveis do "​modbird2"​ e veja se ainda tem alguma variável com VIF maior que 4.+
  
-8Repita esses procedimentos até não haver nenhuma ​variável com VIF maior que 4.+7Calcule os VIFs das variáveis do modelo "​carbon2"​ usando o caminho **Models -> Numerical diagnostics -> Variance-inflation factors** e veja se ainda tem alguma ​variável com VIF maior que 4.
  
-9Mesmo sem ter variáveis colineares, é possível que algumas das variáveis remanescentes ​não sejam relevantes para definir o número de espécies de aves. Então, agora, crie um modelo completo, ​que inclua as variáveis remanescentes e suas interações e realize o procedimento de seleção do modelo mínimo plausível pelo método de simplificação para o mínimo adequado, conforme explicado no roteiro I de MLM.+8Repita os procedimentos anteriores até não haver nenhuma variável com VIF maior que 4.
  
-10. Analise ​os resultados ​do modelo ​final.+9. E possível que algumas das variáveis remanescentes,​ mesmo que não sejam colineares entre si, não sejam relevantes para definir o estoque de carbono em manguezais. Então, para iniciar o procedimento de seleção de modelos, crie um modelo completo ​ que inclua as variáveis remanescentes **e suas interações** (nomeie como "​carbon_int"​). Analise ​o //summary//do modelo.
  
 +10. Realize o procedimento de seleção do modelo mínimo plausível pelo método de simplificação para o mínimo adequado, conforme explicado no item [[cursos:​planeco:​roteiro:​09-lm02#​simplificando_modelos|Simplificando modelos]] do roteiro I de Modelos Lineares Múltiplos]] ​
  
-===== Modelos Lineares Múltiplos: preditoras contínuas e categóricas =====+11. Analise os resultados do modelo final. 
 +\\ 
 +\\ 
 +\\
  
-{{:​cursos:​planeco:​roteiro:​plotBabies01.png?​400 ​ |}} 
  
  
-Nesse último tópico do bloco vamos resgatar os principais conceitos que emergiram com a generalização do modelo linear, agora com múltiplas preditoras, a partir de um exemplo que tem duas variáveis ​preditoras contínuas e duas categórica. Acreditamos que esse exemplo incorpora as complexidades tratadas e ajuda a agrupar os tópicos que devem ficar atentos nos modelos com múltiplas preditoras. ​    +===== Modelos Lineares Múltiplos: ​preditoras contínuas e categóricas =====
  
 +{{:​cursos:​planeco:​roteiro:​plotBabies01.png?​300 ​ |}}
 +
 +\\
 +\\
 +\\
 +\\
 +Nesse último tópico do bloco vamos resgatar os principais conceitos que emergiram com a generalização do modelo linear, agora com múltiplas preditoras, a partir de um exemplo que tem duas variáveis preditoras contínuas e duas categórica. Acreditamos que esse exemplo incorpora as complexidades tratadas e ajuda a agrupar os tópicos que devem ficar atentos nos modelos com múltiplas preditoras. ​    
 +\\
 +\\
 +\\ 
 +\\
 +\\
 +\\
 +\\
  
 <WRAP center round box 60%> <WRAP center round box 60%>
Linha 142: Linha 160:
   * compreender os termos de interação;​   * compreender os termos de interação;​
   * compor o predito pelo modelo a partir dos coeficientes;​   * compor o predito pelo modelo a partir dos coeficientes;​
-  * interpretar ​biológicamente ​o resultado do modelo.+  * interpretar ​biologicamente ​o resultado do modelo.
  
  
 </​WRAP>​ </​WRAP>​
 +\\
 +\\
  
 ==== VIF e as interações ==== ==== VIF e as interações ====
cursos/planeco/roteiro/09-lm02b.txt · Última modificação: 2022/04/15 17:03 por adriana