Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
cursos:planeco:roteiro:11-lmm_rcmdr [2022/04/27 09:45] adalardo [Escolha dos efeitos aleatórios] |
cursos:planeco:roteiro:11-lmm_rcmdr [2022/04/27 12:14] (atual) adalardo [Predito pelo Modelo] |
||
---|---|---|---|
Linha 231: | Linha 231: | ||
fixLMM | fixLMM | ||
- | #criando objeto com os coeficientes do modelo (efeitos fixos) | + | #criando objeto com os coeficientes do modelo (efeitos aleatorios) |
randLMM <- ranef(lmm.riq)$Beach | randLMM <- ranef(lmm.riq)$Beach | ||
Linha 514: | Linha 514: | ||
III. utilizar ''anova'' para comparar modelos com estruturas aleatórias aninhadas e mesma estrutura fixa cheia, buscando a simplificação da estrutura aleatória. Para que a comparação seja feita com o ''REML'' é preciso usar o argumento da função ''anova'' como ''refit = FALSE''; | III. utilizar ''anova'' para comparar modelos com estruturas aleatórias aninhadas e mesma estrutura fixa cheia, buscando a simplificação da estrutura aleatória. Para que a comparação seja feita com o ''REML'' é preciso usar o argumento da função ''anova'' como ''refit = FALSE''; | ||
- | IV. Após simplificare a estrutura aleatória seguir simplificando a estrutura fixa de modelos aninhados por ''anova'' utilizando o padrão da ''anova'' com o argumento ''refit = TRUE''. | + | IV. Mantenha a estrutura aleatória selecionada e siga simplificando a estrutura fixa, comparando modelos aninhados por ''anova''. Utilize o padrão da ''anova'' com o argumento ''refit = TRUE''. |
</WRAP> | </WRAP> | ||
<WRAP center round info 80%> | <WRAP center round info 80%> | ||
- | Poderíamos também ajustar um modelo sem efeito aleatório (usando a função ''lm'') e ver se a inclusão do efeito aleatório resulta em um melhor ajuste do modelo, entretanto, a dependência entre as amostras de uma mesma praia são parte do desenho experimental dos dados e acreditamos que essa característica deve ser mantida no modelo. Além disso, é importante lembrar que a retirada de todos os efeitos aleatórios superestima os graus de liberdade do modelo. | + | Poderíamos também ajustar um modelo sem efeito aleatório (usando a função ''lm'') e ver se a inclusão do efeito aleatório resulta em um melhor ajuste do modelo, entretanto, a dependência entre as amostras de uma mesma praia são parte do desenho experimental dos dados e acreditamos que essa característica deve ser mantida no modelo. Além disso, é importante lembrar que a retirada de todos os efeitos aleatórios superestima os graus de liberdade do modelo, ou seja o modelo linear estaria inflado no seu poder de explicação da variabilidade dos dados. |
</WRAP> | </WRAP> | ||
- | A sequência do procedimento para o nosso exemplo, seria: | + | A sequência do procedimento de simplificação da estrutura aleatória para o nosso exemplo, seria: |
Linha 539: | Linha 539: | ||
</code> | </code> | ||
- | * Compare os modelos anteriores com o comando ''anova'' como temos feito para fazer a seleção dos modelos aninhados, buscando sempre a simplificação do modelo ao mínimo adequado, usando o menu do Rcmdr ''Models > Hipothesis tests > Compare two models...'' e selecionando os modelos ''lmmint'' e ''lmmfull''. | + | * Compare os modelos anteriores com o comando ''anova'' buscando a simplificação do modelo ao mínimo adequado((note que estes modelos são aninhados, a estrutura aleatória no inclinação ''NAP'' incorpora o intercepto também, apesar de não estar explicito na nossa formulação)), usando o menu do Rcmdr ''Models > Hipothesis tests > Compare two models...'' e selecionando os modelos ''lmmint'' e ''lmmfull''. |
<WRAP center round important 90%> | <WRAP center round important 90%> | ||
Linha 566: | Linha 566: | ||
Note que as estimativas do primeiro resultado (ou seja, da anova com reajuste para ML) e do segundo resultado (ou seja, sem reajuste para ML, usando ''refit = FALSE'') são diferentes. É importante saber que **no processo de simplificação da __estrutura aleatória__ do modelo** devemos ignorar os primeiros resultados, pois __não queremos que seja feito um reajuste para ML__, ou seja, **queremos que a comparação das estruturas aleatórias seja feita usando as estimativas por REML**. | Note que as estimativas do primeiro resultado (ou seja, da anova com reajuste para ML) e do segundo resultado (ou seja, sem reajuste para ML, usando ''refit = FALSE'') são diferentes. É importante saber que **no processo de simplificação da __estrutura aleatória__ do modelo** devemos ignorar os primeiros resultados, pois __não queremos que seja feito um reajuste para ML__, ou seja, **queremos que a comparação das estruturas aleatórias seja feita usando as estimativas por REML**. | ||
- | O "p-valor" observado nessa comparação é alto, indicando que os modelos não apresentam diferenças marcantes, sendo assim, devemos reter o modelo mais simples e seguimos simplificando. Como só há mais um termo na estrutura randômica modelando o intercepto, podemos finalizar a seleção da estrutura aleatória aqui. | + | O "p-valor" observado nessa comparação é alto, indicando que os modelos não apresentam diferenças marcantes, sendo assim, devemos reter o modelo mais simples e seguimos simplificando. Como só há mais um termo na estrutura aleatória modelando o intercepto, podemos finalizar a seleção da estrutura aleatória aqui. |
<WRAP center round info 80%> | <WRAP center round info 80%> | ||
- | Alguns autores ((inclusive o próprio Zuur do capítulo que indicamos nesse tutorial como leitura)) advogam que se nenhum termo da estrutura randômica for significativo, deve-se abandonar o modelo misto e partir para o modelo linear sem estrutura aleatória. De fato, isso facilitaria muito a interpretação e a apresentação dos resultados do modelo. Porém, outros autores que seguiremos aqui, indicam que devemos manter a coerência do delineamento experimental/amostral e portanto devemos contemplar a dependência das observações de uma mesma praia, utilizando o modelo com a variável randômica ''praia'' no intercepto. | + | Alguns autores ((inclusive o próprio Zuur do capítulo que indicamos nesse tutorial como leitura)) advogam que se nenhum termo da estrutura aleatória for significativo, deve-se abandonar o modelo misto e partir para o modelo linear sem estrutura aleatória. De fato, isso facilitaria muito a interpretação e a apresentação dos resultados do modelo. Porém, outros autores que seguiremos aqui, indicam que devemos manter a coerência do delineamento experimental/amostral e portanto devemos contemplar a dependência das observações de uma mesma praia, utilizando o modelo com a variável aleatória ''Beach'' no intercepto. |
</WRAP> | </WRAP> | ||
Linha 585: | Linha 585: | ||
*/ | */ | ||
- | Após simplificar a estrutura de efeito aleatório o resultado é que as praias diferem na riqueza média, mas essa variação das praias não está relacionada com o ''NAP''. | + | Após simplificar a estrutura de efeito aleatório o resultado é que as praias diferem na riqueza média, mas essa variação das praias não influencia a relação de ''Richness'' com o ''NAP''. |
Note que quando observamos o primeiro gráfico desse tutorial, parecia que a inclusão de diferentes inclinações para cada praia no modelo seria importante. Porém, o resultado desse teste acima nos indica que, apesar de algumas praias terem inclinações aparentemente diferentes, não ganhamos muita informação adicional relevante ao incluir inclinações diferentes para todas as nove praias. | Note que quando observamos o primeiro gráfico desse tutorial, parecia que a inclusão de diferentes inclinações para cada praia no modelo seria importante. Porém, o resultado desse teste acima nos indica que, apesar de algumas praias terem inclinações aparentemente diferentes, não ganhamos muita informação adicional relevante ao incluir inclinações diferentes para todas as nove praias. | ||
Linha 604: | Linha 604: | ||
</code> | </code> | ||
- | Caso esse modelo mais simples seja significativo, podemos continuar a simplificação com os modelos só com ''NAP'' ou só com ''fExposure'', comparando com o que contém ambos termos ''fExposure + NAP''. | + | Caso o modelo mais simples tenha um poder de explicação da variação dos dados similar ao mais complexo, devemos continuar a simplificação com os modelos só com ''NAP'' ou só com ''fExposure''. Nos dois casos iremos comparar com o modelo que contém ambos termos ''fExposure + NAP'', para que os modelos comparados sejam aninhados ((não é possível comparar o modelo só com ''NAP'' com o modelo só com ''fExposure''!)). |
Siga a simplificação até chegar ao modelo mínimo adequado para esse conjunto de dados. | Siga a simplificação até chegar ao modelo mínimo adequado para esse conjunto de dados. | ||
Linha 693: | Linha 693: | ||
===== Modelos Mistos Exemplos ===== | ===== Modelos Mistos Exemplos ===== | ||
- | Vamos treinar um pouco os modelos mistos olhando outros exemplos, buscando sempre entender o conceito de variáveis fixas e aleatórias e treinando a interpretação do resultado dos modelos | + | Vamos nos debruçar um pouco mais nos modelos mistos olhando outros exemplos, buscando sempre entender o conceito de variáveis fixas e aleatórias e treinando a interpretação do resultado dos modelos |
==== Crescimento de Árvores ==== | ==== Crescimento de Árvores ==== | ||
- | O interesse deste estudo foi entender se a **deciduidade** (perda de folha síncrona) de árvores está relacionada ao crescimento do indivíduo. Os pesquisadores não estavam interessados se espécies distintas tem crescimentos diferentes, entretanto a perda de folha síncrona é característica da espécie e eles precisaram incluir essa variavel no desenho experimental. | + | O interesse deste estudo foi entender se a **deciduidade** (perda de folha síncrona) de árvores está relacionada ao crescimento do indivíduo. Os pesquisadores não estavam interessados se espécies distintas tem crescimentos diferentes, entretanto a perda de folha síncrona é característica da espécie e eles precisaram incluir essa variável no desenho experimental. |
- | No estudo em questão amostraram ''5'' espécies decíduas e outras ''5'' perenes (não perdem as folhas no mesmo período do ano) e, para cada espécie, anotaram o crescimento de '''10'' árvores. Como indivíduos de uma mesma espécie são mais parecidos entre sí do que indivíduos de outras espécies, essa observações não são independentes e precisam ser contempladas no modelo. Um outro complicador é que árvores de diferentes tamanhos ou idades tem crescimentos diferentes. Por isso inclui-se no estudo o tamanho da árvore como uma preditora fixa e com isso os pesquisadores condicionaram o crescimento a variável tamanho. | + | No estudo em questão amostraram ''5'' espécies decíduas e outras ''5'' perenes (não perdem as folhas no mesmo período do ano) e, para cada espécie, anotaram o crescimento de '''10'' árvores. Como indivíduos de uma mesma espécie são mais parecidos entre sí do que indivíduos de outras espécies, essa observações não são independentes e precisam ser contempladas no modelo. Um outro complicador é que árvores de diferentes tamanhos ou idades tem crescimentos diferentes. Por isso inclui-se no estudo o tamanho da árvore como uma preditora fixa e com isso os pesquisadores condicionaram o crescimento à variável tamanho. Assista ao vídeo abaixo que mostra esse exemplo. |
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
Linha 739: | Linha 739: | ||
- | Para entender os dados utilize o menu ''Help'' > ''Help on active data set (if available)''. Leia da documentação que irá se abrir onde há uma descrição dos dados: | + | Para entender os dados utilize o menu ''Help'' > ''Help on active data set (if available)'' e leia a documentação que irá se abrir onde há uma descrição das variáveis: |
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
Linha 776: | Linha 776: | ||
==== Atividade ==== | ==== Atividade ==== | ||
- | * Construa um modelo cheio tendo como variável resposta o rendimento de cultivo (''Y'') e como preditoras as variáveis fixas variedade (''V''), adubação nitrogenada (''N'') e a interação entre as duas. Como estrutura aleatória utilize o fator aleatório plot (''P'') aninhado dentro de bloco (''B'')((a sintaxe aqui é ''(1|B/P)'')). Note que como não temos variáveis fixas contínuas, apenas categóricas, não precisamos modelar a inclinação do modelo, apenas o intercepto. | + | * Construa um modelo cheio tendo como variável resposta o rendimento de cultivo ('' Y '') e como preditoras as variáveis fixas variedade ('' V ''), adubação nitrogenada ('' N '') e a interação entre as duas. Como estrutura aleatória utilize o fator aleatório plot ('' P '') aninhado dentro de bloco ('' B ''), com a sintaxe ''(1|B/P)''. Note que, como não temos variáveis fixas contínuas, apenas categóricas, não há como modelar a inclinação do modelo, apenas o intercepto. |
* Faça a simplificação da estrutura fixa das preditoras e chegue ao modelo mínimo adequado. | * Faça a simplificação da estrutura fixa das preditoras e chegue ao modelo mínimo adequado. | ||
* Faça a interpretação biológica do resultado baseado nos coeficientes fixos e da variação associada aos fatores aleatórios. | * Faça a interpretação biológica do resultado baseado nos coeficientes fixos e da variação associada aos fatores aleatórios. |