Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:12-glmm

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
cursos:planeco:roteiro:12-glmm [2020/03/01 18:12]
adalardo [Diagnósticos dos modelos]
cursos:planeco:roteiro:12-glmm [2021/04/30 15:42] (atual)
adalardo
Linha 1: Linha 1:
-====== Modelos ​Mistos ​Generalizados (GLMM) ======+ 
 +<WRAP tabs> 
 +  * [[cursos:​planeco:​roteiro:​12-glmm_rcmdr|{{:​planeco:​logorcmdr01.png?​20|}}]] 
 +  * [[cursos:​planeco:​roteiro:​12-glmm|{{:​planeco:​rlogo.png?​20|}}]] 
 + 
 +</​WRAP>​ 
 + 
 + 
 +====== Modelos Generalizados ​Mistos ​(GLMM) ====== 
 + 
 +<WRAP center round tip 60%> 
 +Veja esse roteiro associado ao Rcmdr [[cursos:​planeco:​roteiro:​12-glmm_rcmdr|aqui]] 
 + 
 +</​WRAP>​
  
 Este roteiro é uma continuação do roteiro de [[cursos:​planeco:​roteiro:​11-lmm|]] (LMM), o qual deve ser feito e entendido bem antes de continuar. Também é importante que você já tenha estudado o roteiro de [[cursos:​planeco:​roteiro:​10-glm|]] (GLMs). Os modelos GLMM são uma extensão dessas duas abordagens reunidas. Este roteiro é uma continuação do roteiro de [[cursos:​planeco:​roteiro:​11-lmm|]] (LMM), o qual deve ser feito e entendido bem antes de continuar. Também é importante que você já tenha estudado o roteiro de [[cursos:​planeco:​roteiro:​10-glm|]] (GLMs). Os modelos GLMM são uma extensão dessas duas abordagens reunidas.
  
 Ao final do roteiro de LMMs nós observamos que os resíduos do modelo final não atendiam às premissas de homogeneidade de variâncias e normalidade do resíduos. No próprio roteiro, lembramos que a riqueza de espécies (número de espécies no local) é um dado de contagem (valores sempre inteiros e positivos - discretos) e, portanto, não poderíamos utilizar um modelo que tem como premissa a distribuição normal (valores contínuos). Logo, precisaremos utilizar um modelo com uma distribuição diferente da normal. Neste exemplo, vamos recorrer a um GLM com distribuição de ''​Poisson''​ - que lida com os dados de contagem, assim como fizemos no roteiro [[cursos:​planeco:​roteiro:​10-glm#​glm_contagem| GLM contagem]] . Ao final do roteiro de LMMs nós observamos que os resíduos do modelo final não atendiam às premissas de homogeneidade de variâncias e normalidade do resíduos. No próprio roteiro, lembramos que a riqueza de espécies (número de espécies no local) é um dado de contagem (valores sempre inteiros e positivos - discretos) e, portanto, não poderíamos utilizar um modelo que tem como premissa a distribuição normal (valores contínuos). Logo, precisaremos utilizar um modelo com uma distribuição diferente da normal. Neste exemplo, vamos recorrer a um GLM com distribuição de ''​Poisson''​ - que lida com os dados de contagem, assim como fizemos no roteiro [[cursos:​planeco:​roteiro:​10-glm#​glm_contagem| GLM contagem]] .
 +
 +
 +<WRAP center round box 80%>
 +
 +Gráfico básico de diagnóstico do Rcmdr com a distribuição dos resíduos do modelo selecionado no roteiro [[cursos:​planeco:​roteiro:​11-lmm|]].
 +
 +{{  :​cursos:​planeco:​roteiro:​digPraia.png?​500 ​ |}}
 +
 +</​WRAP>​
  
  
 ==== Voltando aos dados da riqueza de espécies das praias ==== ==== Voltando aos dados da riqueza de espécies das praias ====
  
-Vamos voltar ​ao exemplo do livro do Zuur et al. (2009), no qual queremos entender se a riqueza de espécies da macro-fauna em 9 praias na costa da Holanda é influenciado pela altura da estação de amostragem em relação à altura média da maré (`NAP`) ((vamos começar com o modelo mais simples)). As unidades amostrais estão aninhadas dentro das praias, ou seja, temos 5 valores por praia que não podem ser consideradas independentes,​ e por isso incluímos no nosso modelo a praia como um efeito aleatório.+Vamos retornar então ​ao exemplo do livro do Zuur et al. (2009), no qual queremos entender se a riqueza de espécies da macro-fauna em 9 praias na costa da Holanda é influenciado pela altura da estação de amostragem em relação à altura média da maré (''​NAP''​) ((vamos começar com o modelo mais simples)). As unidades amostrais estão aninhadas dentro das praias, ou seja, temos 5 valores por praia que não podem ser consideradas independentes,​ e por isso incluímos no nosso modelo a praia como um efeito aleatório((veja o roteiro [[cursos:​planeco:​roteiro:​11-lmm|]] )).
  
 Dados de contagem, ou seja, o número de espécies em cada amostra, são geralmente modelados com a distribuição de **Poisson**,​ que assume também que a média é igual à variância. Ou seja, se a média aumenta, a variância também. ​ Dados de contagem, ou seja, o número de espécies em cada amostra, são geralmente modelados com a distribuição de **Poisson**,​ que assume também que a média é igual à variância. Ou seja, se a média aumenta, a variância também. ​
Linha 26: Linha 48:
 Então, mãos à massa! ​ Então, mãos à massa! ​
 ==== Lendo os dados no R ==== ==== Lendo os dados no R ====
 +
 +Depois de ler os dados no Rcmdr precisamos modificar a variável ''​fExp''​ para nomear os níveis. Como fizemos no roteiro do **LMM**.
  
   * baixe o arquivo {{ :​cursos:​planeco:​roteiro:​praia.txt |dados vamos à praia}}   * baixe o arquivo {{ :​cursos:​planeco:​roteiro:​praia.txt |dados vamos à praia}}
Linha 32: Linha 56:
   * o arquivo é do tipo texto, com colunas separadas por tabulação ("​Tabs"​) e com decimal indicado por ponto ("​."​)   * o arquivo é do tipo texto, com colunas separadas por tabulação ("​Tabs"​) e com decimal indicado por ponto ("​."​)
   * crie a variável ''​fExposure''​ como fator, como fizemos no LMM   * crie a variável ''​fExposure''​ como fator, como fizemos no LMM
 +
  
 <​code>​ <​code>​
cursos/planeco/roteiro/12-glmm.1583097176.txt.gz · Última modificação: 2020/03/01 18:12 por adalardo