Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior Próxima revisão Ambos lados da revisão seguinte | ||
cursos:planeco:roteiro:11-lmm_rcmdr [2024/04/04 15:44] 127.0.0.1 edição externa |
cursos:planeco:roteiro:11-lmm_rcmdr [2024/04/04 16:12] 127.0.0.1 edição externa |
||
---|---|---|---|
Linha 366: | Linha 366: | ||
*/ | */ | ||
- | ==== Predito pelo Modelo ==== | + | ==== Predito pelo Modelo: riqueza em praias ==== |
Uma boa maneira de interpretar os resultados é a partir do gráfico do predito pelo modelo, se possível junto aos valores das observações dos dados. Temos apresentado gráficos com a experança do modelo ao longo de todo o curso na intenção de auxiliar na interpretação do modelo. Além disso, calcular o predito através dos coeficientes do modelo ajuda a entender a estrutura atrás dos coeficientes. | Uma boa maneira de interpretar os resultados é a partir do gráfico do predito pelo modelo, se possível junto aos valores das observações dos dados. Temos apresentado gráficos com a experança do modelo ao longo de todo o curso na intenção de auxiliar na interpretação do modelo. Além disso, calcular o predito através dos coeficientes do modelo ajuda a entender a estrutura atrás dos coeficientes. | ||
Linha 400: | Linha 400: | ||
</WRAP> | </WRAP> | ||
- | ==== Gráfico do Modelo ==== | + | ==== Gráfico do Modelo: riqueza em praias ==== |
Linha 537: | Linha 537: | ||
- | ===== Inferência e diagnóstico do modelo ===== | + | ==== Inferência e diagnóstico do modelo: riqueza em praias ==== |
Nesta parte, depois de já escolhermos a estrutura aleatória do nosso modelo, podemos averiguar qual a real influência dos efeitos fixos sobre a riqueza de espécies, utilizando o procedimento que temos adotado nessa disciplina, ou seja o **teste de hipóteses por meio da comparação de modelos pela tabela de ANOVA**. Depois de selecionarmos o modelo mínimo adequado, que melhor se ajusta aos dados, vamos fazer o diagnóstico dos resíduos deste modelo para ver se ele atende às premissas de um modelo linear misto. | Nesta parte, depois de já escolhermos a estrutura aleatória do nosso modelo, podemos averiguar qual a real influência dos efeitos fixos sobre a riqueza de espécies, utilizando o procedimento que temos adotado nessa disciplina, ou seja o **teste de hipóteses por meio da comparação de modelos pela tabela de ANOVA**. Depois de selecionarmos o modelo mínimo adequado, que melhor se ajusta aos dados, vamos fazer o diagnóstico dos resíduos deste modelo para ver se ele atende às premissas de um modelo linear misto. | ||
- | ==== Teste de hipótese ==== | + | ==== Seleção de modelo: riqueza em praias ==== |
O procedimento para verificar se termos do modelo são ou não significativos é a construção de modelos aninhados (ou seja, retirando um parâmetro do modelo com mais parâmetros) e a comparação por uma tabela de ''anova''. | O procedimento para verificar se termos do modelo são ou não significativos é a construção de modelos aninhados (ou seja, retirando um parâmetro do modelo com mais parâmetros) e a comparação por uma tabela de ''anova''. | ||
Linha 605: | Linha 605: | ||
- | ===== Seleção de Modelo Mistos ===== | + | ==== Seleção de LMM: riqueza em praias ==== |
Uma questão central em planejamento e análise de dados é decidir como compor um conjunto de modelos plausíveis a partir das hipóteses e um conjunto de variáveis. Além disso, a partir deste conjunto de modelos plausíveis, é preciso tomar a decisão sobre qual((ou quais)) é o melhor para representar nossos dados. Nesse curso utilizamos a partição da variação para comparar modelos aninhados. Vamos continuar a usar o mesmo procedimento, ou seja, fazer o teste de hipótese para comparar modelos dois a dois a partir do modelo cheio para chegar ao mínimo adequado. Esse procedimento se torna mais complexo nos modelos mistos ao envolver a simplificação da estrutura aleatória, além da estrutura fixa, como fizemos nos modelos anteriores. | Uma questão central em planejamento e análise de dados é decidir como compor um conjunto de modelos plausíveis a partir das hipóteses e um conjunto de variáveis. Além disso, a partir deste conjunto de modelos plausíveis, é preciso tomar a decisão sobre qual((ou quais)) é o melhor para representar nossos dados. Nesse curso utilizamos a partição da variação para comparar modelos aninhados. Vamos continuar a usar o mesmo procedimento, ou seja, fazer o teste de hipótese para comparar modelos dois a dois a partir do modelo cheio para chegar ao mínimo adequado. Esse procedimento se torna mais complexo nos modelos mistos ao envolver a simplificação da estrutura aleatória, além da estrutura fixa, como fizemos nos modelos anteriores. | ||
Linha 614: | Linha 614: | ||
+ | <WRAP center round todo 80%> | ||
- | === Ajustando os dados === | + | === Ajustando os dados: riqueza em praias === |
- | + | Os dados que estamos usando estão disponíveis no [[https://github.com/jmadin/zuur/blob/master/data/RIKZ.txt|github do livro do Zuur et al. (2009)]]. A variável ''Exposure'' originalmente tem ''3'' níveis: ''8'', ''10'' e ''11''. Como o nível ''8'' foi observado apenas em uma praia, reclassificamos esta praia para o nível seguinte, no caso o ''10'' (Zuur et al. 2009). | |
- | Os dados que estamos usando estão disponíveis no site do livro do Zuur et al. (2009). A variável ''Exposure'' originalmente tem ''3'' níveis: ''8'', ''10'' e ''11''. Como o nível ''8'' foi observado apenas em uma praia, reclassificamos esta praia para o nível seguinte, no caso o ''10'' (Zuur et al. 2009). | + | |
Linha 632: | Linha 632: | ||
+ | |||
+ | </WRAP> | ||
- | ===== Escolha dos efeitos aleatórios ===== | + | ==== Seleção dos efeitos aleatórios: riqueza em praias ==== |
Existem modelos e, portanto, perguntas e delineamentos amostrais que requerem apenas um efeito aleatório para indicar o agrupamento dos dados. Entretanto, como colocado na seção anterior, há também modelos que podem incluir mais de um efeito aleatório. Esse é o caso da interação entre ''praia'' e ''NAP'' mencionada acima. | Existem modelos e, portanto, perguntas e delineamentos amostrais que requerem apenas um efeito aleatório para indicar o agrupamento dos dados. Entretanto, como colocado na seção anterior, há também modelos que podem incluir mais de um efeito aleatório. Esse é o caso da interação entre ''praia'' e ''NAP'' mencionada acima. | ||
Linha 736: | Linha 738: | ||
Note que quando observamos o primeiro gráfico desse tutorial, parecia que a inclusão de diferentes inclinações para cada praia no modelo seria importante. Porém, o resultado desse teste acima nos indica que, apesar de algumas praias terem inclinações aparentemente diferentes, não ganhamos muita informação adicional relevante ao incluir inclinações diferentes para todas as nove praias. | Note que quando observamos o primeiro gráfico desse tutorial, parecia que a inclusão de diferentes inclinações para cada praia no modelo seria importante. Porém, o resultado desse teste acima nos indica que, apesar de algumas praias terem inclinações aparentemente diferentes, não ganhamos muita informação adicional relevante ao incluir inclinações diferentes para todas as nove praias. | ||
- | ===== Estrutura fixa do modelo ===== | + | ==== Estrutura fixa do modelo: riqueza de praias ==== |
Linha 793: | Linha 795: | ||
<WRAP center round alert 90%> | <WRAP center round alert 90%> | ||
- | **OPS!** Olhando o gráfico diagnóstico dos resíduos, parece que os dados não são tão homocedásticos como deveriam, pois vemos algo parecido com um funil se abrindo da esquerda para a direita, o que indica que o modelo viola esta premissa. Isso não deveria ser uma surpresa já que a variável ''Richness'' é uma contagem e como tal tem a variância acoplada à média. | + | **OPS!** Olhando o gráfico diagnóstico dos resíduos, parece que os dados não são tão homocedásticos como deveriam, pois vemos algo parecido com um funil se abrindo da esquerda para a direita, o que indica que o modelo viola esta premissa. Isso não deveria ser um |
+ | === Ajustando os dados === | ||
+ | |||
+ | |||
+ | Os dados que estamos usando estão disponíveis no [[https://github.com/jmadin/zuur/blob/master/data/RIKZ.txt|github do livro do Zuur et al. (2009)]]. A variável ''Exposure'' originalmente tem ''3'' níveis: ''8'', ''10'' e ''11''. Como o nível ''8'' foi observado apenas em uma praia, reclassificamos esta praia para o nível seguinte, no caso o ''10'' (Zuur et al. 2009). | ||
+ | |||
+ | |||
+ | A partir da variável ''Exposure'', criamos a ''fExp'' que contempla apenas os valores **10** e **11** para designar os dois níveis de exposição das praias. Para tornar essa variável mais explicita com relação ao seu significado vamos transformar os valores **10** e **11** de ''fExp'' em fatores **low** e **high**, nesta ordem, criando uma nova variável ''fExposure'': | ||
+ | |||
+ | * abra o menu ''Data'' > ''Manage variables in active data set'' > ''Convert numeric variables to factors...''; | ||
+ | * coloque o nome da nova variável como ''fExposure'' no campo ''<same as variable>''; | ||
+ | * deixe selecionada a opção ''Supply level names''; | ||
+ | * no quadro que irá se abrir digite ''low'' para o valor ''10'' e ''high'' para o valor ''11''; | ||
+ | * após criar verifique se a variável foi corretamente criada clicando no botão ''View data set''. | ||
+ | |||
+ | |||
+ | |||
+ | a surpresa já que a variável ''Richness'' é uma contagem e como tal tem a variância acoplada à média. | ||
**E agora??!** Bem, quase sempre existe um caminho! O problema aqui é que assumimos que a riqueza de espécies, uma variável de contagem, poderia ser modelada como uma distribuição normal. Entretanto, dados de contagem geralmente são melhor modelados usando a distribuição de ''Poisson''. Já aprendemos isso no tutorial [[cursos:planeco:roteiro:10-glmpoisson]]. | **E agora??!** Bem, quase sempre existe um caminho! O problema aqui é que assumimos que a riqueza de espécies, uma variável de contagem, poderia ser modelada como uma distribuição normal. Entretanto, dados de contagem geralmente são melhor modelados usando a distribuição de ''Poisson''. Já aprendemos isso no tutorial [[cursos:planeco:roteiro:10-glmpoisson]]. | ||
Linha 829: | Linha 848: | ||
**PARA ENTREGAR ANTES DA PRÓXIMA AULA** | **PARA ENTREGAR ANTES DA PRÓXIMA AULA** | ||
- | Acesse o [[https://forms.gle/WBDh238JvtpmuvV9A|formulário]] e responda às questões propostas referentes aos dados sobre a riqueza em praias. | + | Acesse o [[https://forms.gle/AEk1zdTyYzXu2MnV7|formulário]] e responda às questões propostas referentes aos dados sobre a riqueza em praias. |
- | + | ||
- | + | ||
- | {{url>https://forms.gle/WBDh238JvtpmuvV9A}} | + | |
Linha 922: | Linha 938: | ||
**PARA ENTREGAR ANTES DA PRÓXIMA AULA** | **PARA ENTREGAR ANTES DA PRÓXIMA AULA** | ||
- | Acesse o [[https://forms.gle/ciCcS4ytXDBJyrfn9|formulário]] e responda às questões propostas referentes aos dois exemplos (Praias e Aveia) trabalhados nesse tutorial. | + | Acesse o [[https://forms.gle/T9LpETUubgpq8QN48|formulário]] e responda às questões propostas referentes aos dois exemplos (Praias e Aveia) trabalhados nesse tutorial. |
- | + | ||
- | {{url>https://forms.gle/ciCcS4ytXDBJyrfn9}} | ||
</WRAP> | </WRAP> | ||