Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:11-lmm_rcmdr

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
cursos:planeco:roteiro:11-lmm_rcmdr [2024/04/04 15:29]
127.0.0.1 edição externa
cursos:planeco:roteiro:11-lmm_rcmdr [2024/04/04 16:58] (atual)
Linha 143: Linha 143:
 $$ \epsilon_{\beta} = N(0, \sigma_{\beta}) $$ $$ \epsilon_{\beta} = N(0, \sigma_{\beta}) $$
 $$ \epsilon_{\text{res}} = N(0, \sigma_{\text{res}}) $$ $$ \epsilon_{\text{res}} = N(0, \sigma_{\text{res}}) $$
 +
 +
 +<WRAP center round tip 80%>
 +
 +
 +=== LMM no Rcmdr ===
 +
 +Existem vários pacotes disponíveis no R para realizar análises de modelos mistos. Neste roteiro usaremos o ''​lme4''​ (Bates et al. 2014), que possui funções para analisar modelos lineares mistos, modelos lineares mistos generalizados e modelos mistos não lineares. ​
 +
 +Desde o ano de 2020, os modelos mistos passaram a ser contemplados no Rcmdr. Por isso, podemos utilizar essa interface para fazer os modelos. Nas versões recentes do Rcmdr o pacote ''​lme4''​ é carregado por padrão quando se constroi um modelo misto. Caso ele não seja carregado automaticamente,​ é possível carregá-lo. Para isso, vá em ''​Tools -> load packages''​ e escolha ''​lme4''​((Caso queira usar as funções que utilizaremos a seguir no console do ''​R''​ diretamente,​ você precisará instalar e carregar o mesmo pacote)). ​
 +
 +
 +</​WRAP>​
 +
  
  
Linha 179: Linha 193:
 </​WRAP>​ </​WRAP>​
  
 +</​WRAP>​
 +
 +
 +<WRAP center round help 90%>
 +
 +**PARA ENTREGAR ANTES DA PRÓXIMA AULA**
 +Acesse o [[https://​forms.gle/​Uh7QZvrKmcFFNkHX6|formulário]] e responda às questões propostas referentes aos dados sobre crescimento de árvores. ​
  
  
 </​WRAP>​ </​WRAP>​
 +
 +
 +
 +
  
 ===== Riqueza em praias ===== ===== Riqueza em praias =====
Linha 219: Linha 244:
 Nesta figura temos as retas do modelo linear simples entre ''​Riqueza''​ e ''​NAP''​ aplicado para cada praia . Entretanto, a pergunta do estudo não diz respeito a cada praia separadamente,​ o objetivo é modelar a relação para todas as praias amostradas, sem especificar o que acontece para cada praia isoladamente. Por outro lado, se considerarmos cada ponto de amostragem como se fossem independente entre si, estaremos incorrendo em um erro denominado de pseudo-replicação ou falta de independência das observações((podemos dizer também que as observações da mesma praia são correlacionadas)). Ou seja, queremos considerar essa dependência sem falar especificamente de nenhuma praia e, ao mesmo tempo, avaliar a variação associada às praias. Além disso, queremos que as praias amostradas representem uma amostra aleatória de todas as praias que poderíamos ​ contemplar no nosso estudo. Nesta figura temos as retas do modelo linear simples entre ''​Riqueza''​ e ''​NAP''​ aplicado para cada praia . Entretanto, a pergunta do estudo não diz respeito a cada praia separadamente,​ o objetivo é modelar a relação para todas as praias amostradas, sem especificar o que acontece para cada praia isoladamente. Por outro lado, se considerarmos cada ponto de amostragem como se fossem independente entre si, estaremos incorrendo em um erro denominado de pseudo-replicação ou falta de independência das observações((podemos dizer também que as observações da mesma praia são correlacionadas)). Ou seja, queremos considerar essa dependência sem falar especificamente de nenhuma praia e, ao mesmo tempo, avaliar a variação associada às praias. Além disso, queremos que as praias amostradas representem uma amostra aleatória de todas as praias que poderíamos ​ contemplar no nosso estudo.
  
-==== Efeito Aleatório ====+==== Efeito Aleatório: riqueza em praias ​====
  
 Para isso, precisamos de um modelo linear que incorpore o fato de que nossos dados estão agrupados em praias. Chamamos de **efeito aleatório** uma variável que agrupa nossos dados e que, geralmente, seu efeito sobre a variável resposta não nos interessa diretamente ((nesse exemplo não interessa, mas dependendo da análise, pode interessar - veja discussão em McGill 2015)). Nesse exemplo, os autores amostraram ''​9''​ praias, mas poderiam ter feito o mesmo estudo amostrando outras ''​9''​ praias em uma amostra aleatória. Nesse sentido, as ''​9''​ praias da amostra são apenas ''​9''​ possíveis praias amostradas aleatoriamente de todas as possíveis ''​9''​ que poderiam ter sido amostradas ao acaso. Por esta razão, ''​praias''​ é um variável aleatória. Para isso, precisamos de um modelo linear que incorpore o fato de que nossos dados estão agrupados em praias. Chamamos de **efeito aleatório** uma variável que agrupa nossos dados e que, geralmente, seu efeito sobre a variável resposta não nos interessa diretamente ((nesse exemplo não interessa, mas dependendo da análise, pode interessar - veja discussão em McGill 2015)). Nesse exemplo, os autores amostraram ''​9''​ praias, mas poderiam ter feito o mesmo estudo amostrando outras ''​9''​ praias em uma amostra aleatória. Nesse sentido, as ''​9''​ praias da amostra são apenas ''​9''​ possíveis praias amostradas aleatoriamente de todas as possíveis ''​9''​ que poderiam ter sido amostradas ao acaso. Por esta razão, ''​praias''​ é um variável aleatória.
Linha 243: Linha 268:
 Ambos, $\epsilon_{\text{praia}}$ e $\epsilon_{\text{res}}$,​ são variáveis aleatórias com média ''​zero''​ e desvios padrão $\sigma_{\text{praia}}$ e  $\sigma_{\text{res}}$,​ respectivamente. ​ Ambos, $\epsilon_{\text{praia}}$ e $\epsilon_{\text{res}}$,​ são variáveis aleatórias com média ''​zero''​ e desvios padrão $\sigma_{\text{praia}}$ e  $\sigma_{\text{res}}$,​ respectivamente. ​
    
-=====  LMM: riqueza em praias =====+====  LMM: riqueza em praias =====
- +
-Existem vários pacotes disponíveis no R para realizar análises de modelos mistos. Neste roteiro usaremos o ''​lme4''​ (Bates et al. 2014), que possui funções para analisar modelos lineares mistos, modelos lineares mistos generalizados e modelos mistos não lineares.  +
- +
-Desde o ano de 2020, os modelos mistos passaram a ser contemplados no Rcmdr. Por isso, podemos utilizar essa interface para fazer os modelos nesse curso. Porém, lembre-se que estamos utilizando o pacote ''​lme4''​ para a construção destes modelos. Então, precisamos carregá-lo quando o **Rcmdr** é aberto. Para isso, vá em ''​Tools -> load packages''​ e escolha ''​lme4''​((Caso queira usar as funções que utilizaremos a seguir no console do ''​R''​ diretamente,​ você precisará instalar e carregar o mesmo pacote)). ​+
  
  
Linha 303: Linha 324:
 */ */
  
-==== Um modelo plausível ====+==== Um modelo plausível: riqueza em praias ​====
  
 Vamos construir um modelo simmples que tem apenas ''​NAP''​ como variável fixa preditora e a variável ''​Beach''​ como aleatória apenas no intercepto. ​ Esse modelo pode ser descrito no ''​lme4''​ da seguinte forma((pacotes podem ter diferentes sintaxes para descrever modelos mistos)): Vamos construir um modelo simmples que tem apenas ''​NAP''​ como variável fixa preditora e a variável ''​Beach''​ como aleatória apenas no intercepto. ​ Esse modelo pode ser descrito no ''​lme4''​ da seguinte forma((pacotes podem ter diferentes sintaxes para descrever modelos mistos)):
Linha 329: Linha 350:
 Em seguida, vamos dar uma olhada no resultado deste modelo que aparece na janela inferior do Rcmdr. Em seguida, vamos dar uma olhada no resultado deste modelo que aparece na janela inferior do Rcmdr.
  
-==== Interpretando o modelo ====+==== Interpretando o modelo: riqueza em praias ​====
  
 Na figura abaixo temos o resultado resumido do modelo ''​lmm.riq'':​ Na figura abaixo temos o resultado resumido do modelo ''​lmm.riq'':​
Linha 356: Linha 377:
 */ */
  
-==== Predito pelo Modelo ====+==== Predito pelo Modelo: riqueza em praias ​====
  
 Uma boa maneira de interpretar os resultados é a partir do gráfico do predito pelo modelo, se possível junto aos valores das observações dos dados. Temos apresentado gráficos com a experança do modelo ao longo de todo o curso na intenção de auxiliar na interpretação do modelo. Além disso, calcular o predito através dos coeficientes do modelo ajuda a entender a estrutura atrás dos coeficientes. Uma boa maneira de interpretar os resultados é a partir do gráfico do predito pelo modelo, se possível junto aos valores das observações dos dados. Temos apresentado gráficos com a experança do modelo ao longo de todo o curso na intenção de auxiliar na interpretação do modelo. Além disso, calcular o predito através dos coeficientes do modelo ajuda a entender a estrutura atrás dos coeficientes.
Linha 390: Linha 411:
 </​WRAP>​ </​WRAP>​
  
-==== Gráfico do Modelo ====+==== Gráfico do Modelo: riqueza em praias ​====
  
  
Linha 527: Linha 548:
  
  
-===== Inferência e diagnóstico do modelo ​=====+==== Inferência e diagnóstico do modelo: riqueza em praias ​====
  
 Nesta parte, depois de já escolhermos a estrutura aleatória do nosso modelo, podemos averiguar qual a real influência dos efeitos fixos sobre a riqueza de espécies, utilizando o procedimento que temos adotado nessa disciplina, ou seja o **teste de hipóteses por meio da comparação de modelos pela tabela de ANOVA**. Depois de selecionarmos o modelo mínimo adequado, que melhor se ajusta aos dados, vamos fazer o diagnóstico dos resíduos deste modelo para ver se ele atende às premissas de um modelo linear misto. Nesta parte, depois de já escolhermos a estrutura aleatória do nosso modelo, podemos averiguar qual a real influência dos efeitos fixos sobre a riqueza de espécies, utilizando o procedimento que temos adotado nessa disciplina, ou seja o **teste de hipóteses por meio da comparação de modelos pela tabela de ANOVA**. Depois de selecionarmos o modelo mínimo adequado, que melhor se ajusta aos dados, vamos fazer o diagnóstico dos resíduos deste modelo para ver se ele atende às premissas de um modelo linear misto.
  
  
-==== Teste de hipótese ​====+==== Seleção ​de modelo: riqueza em praias ​====
  
 O procedimento para verificar se termos do modelo são ou não significativos é a construção de modelos aninhados (ou seja, retirando um parâmetro do modelo com mais parâmetros) e a comparação por uma tabela de ''​anova''​. ​ O procedimento para verificar se termos do modelo são ou não significativos é a construção de modelos aninhados (ou seja, retirando um parâmetro do modelo com mais parâmetros) e a comparação por uma tabela de ''​anova''​. ​
Linha 595: Linha 616:
  
  
-===== Seleção de Modelo Mistos =====+==== Seleção de LMM: riqueza em praias ​====
  
 Uma questão central em planejamento e análise de dados é decidir como compor um conjunto de modelos plausíveis a partir das hipóteses e um conjunto de variáveis. Além disso, a partir deste conjunto de modelos plausíveis,​ é preciso tomar a decisão sobre qual((ou quais)) é o melhor para representar nossos dados. Nesse curso utilizamos a partição da variação para comparar modelos aninhados. Vamos continuar a usar o mesmo procedimento,​ ou seja, fazer o teste de hipótese para comparar modelos dois a dois a partir do modelo cheio para chegar ao mínimo adequado. Esse procedimento se torna mais complexo nos modelos mistos ao envolver a simplificação da estrutura aleatória, além da estrutura fixa, como fizemos nos modelos anteriores.  ​ Uma questão central em planejamento e análise de dados é decidir como compor um conjunto de modelos plausíveis a partir das hipóteses e um conjunto de variáveis. Além disso, a partir deste conjunto de modelos plausíveis,​ é preciso tomar a decisão sobre qual((ou quais)) é o melhor para representar nossos dados. Nesse curso utilizamos a partição da variação para comparar modelos aninhados. Vamos continuar a usar o mesmo procedimento,​ ou seja, fazer o teste de hipótese para comparar modelos dois a dois a partir do modelo cheio para chegar ao mínimo adequado. Esse procedimento se torna mais complexo nos modelos mistos ao envolver a simplificação da estrutura aleatória, além da estrutura fixa, como fizemos nos modelos anteriores.  ​
Linha 604: Linha 625:
  
  
 +<WRAP center round todo 80%>
  
-=== Ajustando os dados ===+=== Ajustando os dados:  riqueza em praias ​===
  
  
- +Os dados que estamos usando estão disponíveis no [[https://​github.com/​jmadin/​zuur/​blob/​master/​data/​RIKZ.txt|github ​do livro do Zuur et al. (2009)]]. A variável ''​Exposure''​ originalmente tem ''​3''​ níveis: ''​8'',​ ''​10''​ e ''​11''​. Como o nível ''​8''​ foi observado apenas em uma praia, reclassificamos esta praia para o nível seguinte, no caso o ''​10''​ (Zuur et al. 2009).  ​
-Os dados que estamos usando estão disponíveis no site do livro do Zuur et al. (2009). A variável ''​Exposure''​ originalmente tem ''​3''​ níveis: ''​8'',​ ''​10''​ e ''​11''​. Como o nível ''​8''​ foi observado apenas em uma praia, reclassificamos esta praia para o nível seguinte, no caso o ''​10''​ (Zuur et al. 2009).  ​+
  
  
Linha 622: Linha 643:
  
  
 +
 +</​WRAP>​
  
  
-===== Escolha ​dos efeitos aleatórios ​=====+==== Seleção ​dos efeitos aleatórios: riqueza em praias ​====
  
 Existem modelos e, portanto, perguntas e delineamentos amostrais que requerem apenas um efeito aleatório para indicar o agrupamento dos dados. Entretanto, como colocado na seção anterior, há também modelos que podem incluir mais de um efeito aleatório. Esse é o caso da interação entre ''​praia''​ e ''​NAP''​ mencionada acima. ​ Existem modelos e, portanto, perguntas e delineamentos amostrais que requerem apenas um efeito aleatório para indicar o agrupamento dos dados. Entretanto, como colocado na seção anterior, há também modelos que podem incluir mais de um efeito aleatório. Esse é o caso da interação entre ''​praia''​ e ''​NAP''​ mencionada acima. ​
Linha 726: Linha 749:
 Note que quando observamos o primeiro gráfico desse tutorial, parecia que a inclusão de diferentes inclinações para cada praia no modelo seria importante. Porém, o resultado desse teste acima nos indica que, apesar de algumas praias terem inclinações aparentemente diferentes, não ganhamos muita informação adicional relevante ao incluir inclinações diferentes para todas as nove praias. Note que quando observamos o primeiro gráfico desse tutorial, parecia que a inclusão de diferentes inclinações para cada praia no modelo seria importante. Porém, o resultado desse teste acima nos indica que, apesar de algumas praias terem inclinações aparentemente diferentes, não ganhamos muita informação adicional relevante ao incluir inclinações diferentes para todas as nove praias.
  
-===== Estrutura fixa do modelo ​=====+==== Estrutura fixa do modelo: riqueza de praias ​====
  
  
Linha 783: Linha 806:
  
 <WRAP center round alert 90%> <WRAP center round alert 90%>
-**OPS!** Olhando o gráfico diagnóstico dos resíduos, parece que os dados não são tão homocedásticos como deveriam, pois vemos algo parecido com um funil se abrindo da esquerda para a direita, o que indica que o modelo viola esta premissa. Isso não deveria ser uma surpresa já que a variável ''​Richness''​ é uma contagem e como tal tem a variância acoplada à média.+**OPS!** Olhando o gráfico diagnóstico dos resíduos, parece que os dados não são tão homocedásticos como deveriam, pois vemos algo parecido com um funil se abrindo da esquerda para a direita, o que indica que o modelo viola esta premissa. Isso não deveria ser um 
 +=== Ajustando os dados === 
 + 
 + 
 +Os dados que estamos usando estão disponíveis no [[https://​github.com/​jmadin/​zuur/​blob/​master/​data/​RIKZ.txt|github do livro do Zuur et al. (2009)]]. A variável ''​Exposure''​ originalmente tem ''​3''​ níveis: ''​8'',​ ''​10''​ e ''​11''​. Como o nível ''​8''​ foi observado apenas em uma praia, reclassificamos esta praia para o nível seguinte, no caso o ''​10''​ (Zuur et al. 2009). ​  
 + 
 + 
 +A partir da variável ''​Exposure'',​ criamos a ''​fExp''​ que contempla apenas os valores **10** e **11** para designar os dois níveis de exposição das praias. Para tornar essa variável mais explicita com relação ao seu significado vamos transformar os valores **10** e **11** de ''​fExp''​ em fatores **low** e **high**, nesta ordem, criando uma nova variável ''​fExposure'':​ 
 + 
 +  * abra o menu ''​Data''​ > ''​Manage variables in active data set''​ > ''​Convert numeric variables to factors...'';​ 
 +  * coloque o nome da nova variável como ''​fExposure''​ no campo ''<​same as variable>'';​ 
 +  * deixe selecionada a opção ''​Supply level names'';​ 
 +  * no quadro que irá se abrir digite ''​low''​ para o valor ''​10''​ e ''​high''​ para o valor ''​11'';​ 
 +  * após criar verifique se a variável foi corretamente criada clicando no botão ''​View data set''​. 
 + 
 + 
 + 
 +surpresa já que a variável ''​Richness''​ é uma contagem e como tal tem a variância acoplada à média.
  
 **E agora??!** Bem, quase sempre existe um caminho! O problema aqui é que assumimos que a riqueza de espécies, uma variável de contagem, poderia ser modelada como uma distribuição normal. Entretanto, dados de contagem geralmente são melhor modelados usando a distribuição de ''​Poisson''​. Já aprendemos isso no tutorial [[cursos:​planeco:​roteiro:​10-glmpoisson]].  ​ **E agora??!** Bem, quase sempre existe um caminho! O problema aqui é que assumimos que a riqueza de espécies, uma variável de contagem, poderia ser modelada como uma distribuição normal. Entretanto, dados de contagem geralmente são melhor modelados usando a distribuição de ''​Poisson''​. Já aprendemos isso no tutorial [[cursos:​planeco:​roteiro:​10-glmpoisson]].  ​
Linha 819: Linha 859:
  
 **PARA ENTREGAR ANTES DA PRÓXIMA AULA** **PARA ENTREGAR ANTES DA PRÓXIMA AULA**
-Acesse o [[https://​forms.gle/​WBDh238JvtpmuvV9A|formulário]] e responda às questões propostas referentes aos dados sobre a riqueza em praias. ​ +Acesse o [[https://​forms.gle/​AEk1zdTyYzXu2MnV7|formulário]] e responda às questões propostas referentes aos dados sobre a riqueza em praias. ​
- +
- +
-{{url>​https://​forms.gle/​WBDh238JvtpmuvV9A}}+
  
  
Linha 912: Linha 949:
  
 **PARA ENTREGAR ANTES DA PRÓXIMA AULA** **PARA ENTREGAR ANTES DA PRÓXIMA AULA**
-Acesse o [[https://​forms.gle/​ciCcS4ytXDBJyrfn9|formulário]] e responda às questões propostas referentes aos dois exemplos (Praias e Aveia) trabalhados nesse tutorial. ​ +Acesse o [[https://​forms.gle/​T9LpETUubgpq8QN48|formulário]] e responda às questões propostas referentes aos dois exemplos (Praias e Aveia) trabalhados nesse tutorial. ​
- +
  
-{{url>​https://​forms.gle/​ciCcS4ytXDBJyrfn9}} 
 </​WRAP>​ </​WRAP>​
  
cursos/planeco/roteiro/11-lmm_rcmdr.1712255385.txt.gz · Última modificação: 2024/04/04 15:29 por 127.0.0.1