Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:09-lm02b

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
cursos:planeco:roteiro:09-lm02b [2022/04/15 14:58]
adriana [Biomassa de manguezais e variáveis ambientais]
cursos:planeco:roteiro:09-lm02b [2022/04/15 17:03] (atual)
adriana
Linha 71: Linha 71:
 3. Inspecione a correlação entre todas as variáveis preditoras contínuas: 3. Inspecione a correlação entre todas as variáveis preditoras contínuas:
  
-Para fazer isso no R Commander, você tem duas opções:+Para fazer isso no //Rcmdr//, você tem duas opções:
  
-  * Uma opção é avaliar numericamente as correlações. Para isso, entre em **Estatísticas-> Resumos ​-> Matriz de Correlação**, selecione todas as variáveis preditoras e clique em OK. Você verá os valores de correlação de todos os pares de variáveis. Observando os valores mais altos de correlação,​ você já pode ter uma ideia se existem variáveis com potencial para apresentar colinearidade. ​+  * Uma opção é avaliar numericamente as correlações. Para isso, entre em **Statistics-> Summary ​-> Correlation Matrix**, selecione todas as variáveis preditoras e clique em OK. Você verá os valores de correlação de todos os pares de variáveis. Observando os valores mais altos de correlação,​ você já pode ter uma ideia se existem variáveis com potencial para apresentar colinearidade. ​
  
-  * Outra opção é avaliar graficamente as correlações entre as variáveis. Para isso, entre em **Gráficos ​-> Matriz de Dispersão** e selecione todas as variáveis preditoras contínuas. Na aba **Opções** selecione "Linhas de quadrados mínimos" e clique em OK. Na figura que foi gerada, você poderá avaliar quais pares de variáveis parecem ter uma maior correlação entre elas.+  * Outra opção é avaliar graficamente as correlações entre as variáveis. Para isso, entre em **Graphics ​-> Dispersion Matrix** e selecione todas as variáveis preditoras contínuas. Na aba **Options** selecione "Minimum Square Line" e clique em OK. Na figura que foi gerada, você poderá avaliar quais pares de variáveis parecem ter uma maior correlação entre elas.
  
-<WRAP center round important ​80%>+<WRAP center round important ​90%>
 Esse procedimento de analisar a correlação entre todas as nossas variáveis preditoras contínuas deveria ser sempre realizado antes de fazermos nossas análises. ​ Esse procedimento de analisar a correlação entre todas as nossas variáveis preditoras contínuas deveria ser sempre realizado antes de fazermos nossas análises. ​
 </​WRAP>​ </​WRAP>​
  
  
-4. Ajuste um modelo, relacionando AGB-carbon com todas as variáveis preditoras, mas ainda sem incluir as interações. Nomeie esse modelo como "​carbon1"​. No resumo ​do modelo, repare nos efeitos e na significância de cada um dos parâmetros.+4. Ajuste um modelo, relacionando AGB-carbon com todas as variáveis preditoras, mas ainda sem incluir as interações. Nomeie esse modelo como "​carbon1"​. No //​summary// ​do modelo, repare nos efeitos e na significância de cada um dos parâmetros.
  
  
-5. Calcule os VIFs((A função utilizada no R Commander ​para calcular o ''​VIF''​ utiliza uma variante chamada ''​GVIF'',​ uma generalização que pode ser aplicada também para variáveis categóricas com a mesma interpretação colocada acima o ''​GVIF''​ foi desenvolvida pelo John Fox, mesmo autor do Rcmdr. Veja o artigo no link [[https://​www.tandfonline.com/​doi/​abs/​10.1080/​01621459.1992.10475190]])) para as variáveis incluídas no modelo+5. Calcule os VIFs((A função utilizada no //​Rcmdr// ​para calcular o ''​VIF''​ utiliza uma variante chamada ''​GVIF'',​ uma generalização que pode ser aplicada também para variáveis categóricas com a mesma interpretação colocada acima o ''​GVIF''​ foi desenvolvida pelo John Fox, mesmo autor do Rcmdr. Veja o artigo no link [[https://​www.tandfonline.com/​doi/​abs/​10.1080/​01621459.1992.10475190]])) para as variáveis incluídas no modelo
  
-Para isso, entre em **Modelos ​-> Diagnóstico numérico ​-> Fatores de Inflação de Variância**. +Para isso, entre em **Models ​-> Numerical diagnostics ​-> Variance-inflation factors**. O primeiro resultado apresentado é uma linha com os valores de VIF para cada parâmetro do modelo. O segundo resultado apresentado é uma matriz de correlação das __estimativas dos parâmetros__. Note que os valores são diferentes das correlações feitas diretamente para as variáveis (item 3, acima).
-O primeiro resultado apresentado é uma linha com os valores de VIF para cada parâmetro do modelo. O segundo resultado apresentado é uma matriz de correlação das __estimativas dos parâmetros__. Note que os valores são diferentes das correlações feitas diretamente para as variáveis (item 3, acima).+
  
-<WRAP center round important ​80%> +<WRAP center round important ​90%> 
-Importante: Como o valor de VIF de cada parâmetro depende de quais outros parâmetros estão sendo incluídos no modelo, só é possível calcular os VIFs depois de ter ajustado um modelo. Ao usar o R Commander, fique sempre atento(a) se o modelo ativo é o modelo para o qual você quer calcular os VIFs.+Importante: Como o valor de VIF de cada parâmetro depende de quais outros parâmetros estão sendo incluídos no modelo, só é possível calcular os VIFs depois de ter ajustado um modelo. Ao usar o //Rcmdr//, fique sempre atento(a) se o modelo ativo é realmente ​o modelo para o qual você quer calcular os VIFs.
 </​WRAP>​ </​WRAP>​
  
  
-<WRAP center round box 80%>+<WRAP center round box 70%>
  
-Pausa **OPCIONAL** ​se você quiser ​aprender a calcular manualmente os valores de VIF:+**PAUSA OPCIONAL** ​caso você queira ​aprender a calcular manualmente os valores de VIF:
  
 Em primeiro lugar, reveja a equação de cálculo de VIF apresentada acima. Em primeiro lugar, reveja a equação de cálculo de VIF apresentada acima.
  
-Agora, vamos calcular manualmente o valor de VIF para a variável preditora **lat** e comparar com o valor obtido acima no R Commander. Para isso, precisamos calcular o R<​sup>​2</​sup>​ da relação entre essa variável preditora e todas as outras preditoras que estavam no modelo completo, sem as interações (carbon1). Para isso, vamos criar um novo modelo no qual a variável para a qual estamos interessados em calcular o VIF (**lat**) passará agora a ser a __variável resposta__ desse novo modelo que criaremos. ​+Agora, vamos calcular manualmente o valor de VIF para a variável preditora **lat** e comparar com o valor obtido acima no //Rcmdr//. Para isso, precisamos calcular o R<​sup>​2</​sup>​ da relação entre essa variável preditora e todas as outras preditoras que estavam no modelo completo, sem as interações (carbon1). Para isso, vamos criar um novo modelo no qual a variável para a qual estamos interessados em calcular o VIF (**lat**) passará agora a ser a __variável resposta__ desse novo modelo que criaremos. ​
  
-Entre em **Estatísticas ​-> Ajuste de Modelos ​-> Modelo ​Linear**. Coloque **lat** ​__como variável ​resposta__ na caixa da esquerda da equação e coloque as outras 2 variáveis preditoras (**temp** + **ppt**) na caixa da direita da equação. Defina o nome desse modelo como "​viflat"​. No resumo ​do modelo será apresentado o valor de R<​sup>​2</​sup>​ Múltiplo (//Multiple R-square//​). Utilize esse valor na equação de cálculo de VIF e veja se o resultado é igual ao valor de VIF calculado pelo R Commander para a variável **lat** a partir do modelo "​carbon1"​ feito acima. Deveria ser. Se não foi, peça ajuda a alguém da equipe.+Entre em **Statistics ​-> Fit models ​-> Linear ​model**. Coloque **lat** ​como __variável ​resposta__ na caixa da esquerda da equação e coloque as outras 2 variáveis preditoras (**temp** + **ppt**) na caixa da direita da equação. Defina o nome desse modelo como "​viflat"​. No //​summary// ​do modelo será apresentado o valor de R<​sup>​2</​sup>​ Múltiplo (//Multiple R-square//​). Utilize esse valor na equação de cálculo de VIF e veja se o resultado é igual ao valor de VIF calculado pelo R Commander para a variável **lat** a partir do modelo "​carbon1"​ feito acima. Deveria ser. Se não foi, peça ajuda a alguém da equipe.
  
 Repita o mesmo procedimento para outra variável de sua escolha. Você pode fazer isso para todas as variáveis do modelo, se quiser. Repita o mesmo procedimento para outra variável de sua escolha. Você pode fazer isso para todas as variáveis do modelo, se quiser.
Linha 109: Linha 108:
 </​WRAP>​ </​WRAP>​
  
-7. **Continuando nossa análise:** Analisando ​resultado dos VIFs, se houver alguma variável com valor maior que 4, ajuste um novo modelo no qual a variável com o maior VIF seja removida. Coloque "​modbird2"​ como nome desse modelo. Olhe para o //summary// desse modelo e para as variáveis que permaneceram nele. Cheque os valores dos coeficientes e a significância ​de cada variável ​em relação ao modelo "​modbird1"​. Houve alguma alteração?​ Alguma variável deixou de ser significativa?​ Alguma variável passou a ser significativa?​ O sinal do efeito mudou?  +Continuando nossa análise ​sobre estoque ​de Carbono ​em manguezais:
-Depois, calcule os VIFs das variáveis do "​modbird2"​ e veja se ainda tem alguma variável com VIF maior que 4.+
  
-8Repita esses procedimentos até não haver nenhuma ​variável com VIF maior que 4.+6Após analisar os valores dos VIFs do modelo "​carbon1",​ se houver alguma ​variável com valor maior que 4, remova a variável com o maior VIF e ajuste um novo modeloColoque "​carbon2"​ como nome desse modelo. Olhe para o //summary// desse modelo e para as variáveis que permaneceram nele. Cheque os valores dos coeficientes e a significância de cada variável em relação ao modelo "​carbon1"​. **Houve alguma alteração?​ Alguma variável deixou de ser significativa?​ Alguma variável passou a ser significativa?​ O sinal do efeito mudou?​** ​
  
-9Mesmo sem ter variáveis colineares, é possível que algumas ​das variáveis ​remanescentes não sejam relevantes para definir o número de espécies de aves. Então, agora, crie um modelo completo, que inclua as variáveis remanescentes e suas interações e realize o procedimento de seleção ​do modelo ​mínimo plausível pelo método de simplificação para mínimo adequado, conforme explicado no roteiro I de MLM.+7Calcule os VIFs das variáveis do modelo ​"​carbon2"​ usando ​caminho **Models -> Numerical diagnostics -> Variance-inflation factors** e veja se ainda tem alguma variável com VIF maior que 4.
  
-10Analise ​os resultados do modelo final.+8Repita ​os procedimentos anteriores até não haver nenhuma variável com VIF maior que 4.
  
 +9. E possível que algumas das variáveis remanescentes,​ mesmo que não sejam colineares entre si, não sejam relevantes para definir o estoque de carbono em manguezais. Então, para iniciar o procedimento de seleção de modelos, crie um modelo completo ​ que inclua as variáveis remanescentes **e suas interações** (nomeie como "​carbon_int"​). Analise o //​summary//​do modelo.
  
-===== Modelos Lineares Múltiplos: preditoras contínuas e categóricas =====+10. Realize o procedimento de seleção do modelo mínimo plausível pelo método de simplificação para o mínimo adequado, conforme explicado no item [[cursos:​planeco:​roteiro:​09-lm02#​simplificando_modelos|Simplificando modelos]] do roteiro I de Modelos Lineares Múltiplos]] 
  
-{{:​cursos:​planeco:​roteiro:​plotBabies01.png?​400 ​ |}}+11Analise os resultados do modelo final. 
 +\\ 
 +\\ 
 +\\
  
  
-Nesse último tópico do bloco vamos resgatar os principais conceitos que emergiram com a generalização do modelo linear, agora com múltiplas preditoras, a partir de um exemplo que tem duas variáveis preditoras contínuas e duas categórica. Acreditamos que esse exemplo incorpora as complexidades tratadas e ajuda a agrupar os tópicos que devem ficar atentos nos modelos com múltiplas preditoras. ​     
  
 +===== Modelos Lineares Múltiplos: preditoras contínuas e categóricas =====
 +
 +{{:​cursos:​planeco:​roteiro:​plotBabies01.png?​300 ​ |}}
 +
 +\\
 +\\
 +\\
 +\\
 +Nesse último tópico do bloco vamos resgatar os principais conceitos que emergiram com a generalização do modelo linear, agora com múltiplas preditoras, a partir de um exemplo que tem duas variáveis preditoras contínuas e duas categórica. Acreditamos que esse exemplo incorpora as complexidades tratadas e ajuda a agrupar os tópicos que devem ficar atentos nos modelos com múltiplas preditoras. ​    
 +\\
 +\\
 +\\ 
 +\\
 +\\
 +\\
 +\\
  
 <WRAP center round box 60%> <WRAP center round box 60%>
Linha 143: Linha 160:
   * compreender os termos de interação;​   * compreender os termos de interação;​
   * compor o predito pelo modelo a partir dos coeficientes;​   * compor o predito pelo modelo a partir dos coeficientes;​
-  * interpretar ​biológicamente ​o resultado do modelo.+  * interpretar ​biologicamente ​o resultado do modelo.
  
  
 </​WRAP>​ </​WRAP>​
 +\\
 +\\
  
 ==== VIF e as interações ==== ==== VIF e as interações ====
cursos/planeco/roteiro/09-lm02b.1650045503.txt.gz · Última modificação: 2022/04/15 14:58 por adriana