Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
cursos:planeco:roteiro:12-glmm [2020/03/01 18:12] adalardo [Diagnósticos dos modelos] |
cursos:planeco:roteiro:12-glmm [2021/04/30 15:42] (atual) adalardo |
||
---|---|---|---|
Linha 1: | Linha 1: | ||
- | ====== Modelos Mistos Generalizados (GLMM) ====== | + | |
+ | <WRAP tabs> | ||
+ | * [[cursos:planeco:roteiro:12-glmm_rcmdr|{{:planeco:logorcmdr01.png?20|}}]] | ||
+ | * [[cursos:planeco:roteiro:12-glmm|{{:planeco:rlogo.png?20|}}]] | ||
+ | |||
+ | </WRAP> | ||
+ | |||
+ | |||
+ | ====== Modelos Generalizados Mistos (GLMM) ====== | ||
+ | |||
+ | <WRAP center round tip 60%> | ||
+ | Veja esse roteiro associado ao Rcmdr [[cursos:planeco:roteiro:12-glmm_rcmdr|aqui]] | ||
+ | |||
+ | </WRAP> | ||
Este roteiro é uma continuação do roteiro de [[cursos:planeco:roteiro:11-lmm|]] (LMM), o qual deve ser feito e entendido bem antes de continuar. Também é importante que você já tenha estudado o roteiro de [[cursos:planeco:roteiro:10-glm|]] (GLMs). Os modelos GLMM são uma extensão dessas duas abordagens reunidas. | Este roteiro é uma continuação do roteiro de [[cursos:planeco:roteiro:11-lmm|]] (LMM), o qual deve ser feito e entendido bem antes de continuar. Também é importante que você já tenha estudado o roteiro de [[cursos:planeco:roteiro:10-glm|]] (GLMs). Os modelos GLMM são uma extensão dessas duas abordagens reunidas. | ||
Ao final do roteiro de LMMs nós observamos que os resíduos do modelo final não atendiam às premissas de homogeneidade de variâncias e normalidade do resíduos. No próprio roteiro, lembramos que a riqueza de espécies (número de espécies no local) é um dado de contagem (valores sempre inteiros e positivos - discretos) e, portanto, não poderíamos utilizar um modelo que tem como premissa a distribuição normal (valores contínuos). Logo, precisaremos utilizar um modelo com uma distribuição diferente da normal. Neste exemplo, vamos recorrer a um GLM com distribuição de ''Poisson'' - que lida com os dados de contagem, assim como fizemos no roteiro [[cursos:planeco:roteiro:10-glm#glm_contagem| GLM contagem]] . | Ao final do roteiro de LMMs nós observamos que os resíduos do modelo final não atendiam às premissas de homogeneidade de variâncias e normalidade do resíduos. No próprio roteiro, lembramos que a riqueza de espécies (número de espécies no local) é um dado de contagem (valores sempre inteiros e positivos - discretos) e, portanto, não poderíamos utilizar um modelo que tem como premissa a distribuição normal (valores contínuos). Logo, precisaremos utilizar um modelo com uma distribuição diferente da normal. Neste exemplo, vamos recorrer a um GLM com distribuição de ''Poisson'' - que lida com os dados de contagem, assim como fizemos no roteiro [[cursos:planeco:roteiro:10-glm#glm_contagem| GLM contagem]] . | ||
+ | |||
+ | |||
+ | <WRAP center round box 80%> | ||
+ | |||
+ | Gráfico básico de diagnóstico do Rcmdr com a distribuição dos resíduos do modelo selecionado no roteiro [[cursos:planeco:roteiro:11-lmm|]]. | ||
+ | |||
+ | {{ :cursos:planeco:roteiro:digPraia.png?500 |}} | ||
+ | |||
+ | </WRAP> | ||
==== Voltando aos dados da riqueza de espécies das praias ==== | ==== Voltando aos dados da riqueza de espécies das praias ==== | ||
- | Vamos voltar ao exemplo do livro do Zuur et al. (2009), no qual queremos entender se a riqueza de espécies da macro-fauna em 9 praias na costa da Holanda é influenciado pela altura da estação de amostragem em relação à altura média da maré (`NAP`) ((vamos começar com o modelo mais simples)). As unidades amostrais estão aninhadas dentro das praias, ou seja, temos 5 valores por praia que não podem ser consideradas independentes, e por isso incluímos no nosso modelo a praia como um efeito aleatório. | + | Vamos retornar então ao exemplo do livro do Zuur et al. (2009), no qual queremos entender se a riqueza de espécies da macro-fauna em 9 praias na costa da Holanda é influenciado pela altura da estação de amostragem em relação à altura média da maré (''NAP'') ((vamos começar com o modelo mais simples)). As unidades amostrais estão aninhadas dentro das praias, ou seja, temos 5 valores por praia que não podem ser consideradas independentes, e por isso incluímos no nosso modelo a praia como um efeito aleatório((veja o roteiro [[cursos:planeco:roteiro:11-lmm|]] )). |
Dados de contagem, ou seja, o número de espécies em cada amostra, são geralmente modelados com a distribuição de **Poisson**, que assume também que a média é igual à variância. Ou seja, se a média aumenta, a variância também. | Dados de contagem, ou seja, o número de espécies em cada amostra, são geralmente modelados com a distribuição de **Poisson**, que assume também que a média é igual à variância. Ou seja, se a média aumenta, a variância também. | ||
Linha 26: | Linha 48: | ||
Então, mãos à massa! | Então, mãos à massa! | ||
==== Lendo os dados no R ==== | ==== Lendo os dados no R ==== | ||
+ | |||
+ | Depois de ler os dados no Rcmdr precisamos modificar a variável ''fExp'' para nomear os níveis. Como fizemos no roteiro do **LMM**. | ||
* baixe o arquivo {{ :cursos:planeco:roteiro:praia.txt |dados vamos à praia}} | * baixe o arquivo {{ :cursos:planeco:roteiro:praia.txt |dados vamos à praia}} | ||
Linha 32: | Linha 56: | ||
* o arquivo é do tipo texto, com colunas separadas por tabulação ("Tabs") e com decimal indicado por ponto (".") | * o arquivo é do tipo texto, com colunas separadas por tabulação ("Tabs") e com decimal indicado por ponto (".") | ||
* crie a variável ''fExposure'' como fator, como fizemos no LMM | * crie a variável ''fExposure'' como fator, como fizemos no LMM | ||
+ | |||
<code> | <code> |