Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:07a-clasrcmdr

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

cursos:planeco:roteiro:07a-clasrcmdr [2022/03/23 18:35]
ctcastanho [Regressão linear na prática]
cursos:planeco:roteiro:07a-clasrcmdr [2024/03/08 13:01]
Linha 1: Linha 1:
-<WRAP tabs> 
-  * [[cursos:​planeco:​roteiro:​07-classrcmdr|{{:​planeco:​logorcmdr01.png?​20|}}]] 
-  * [[cursos:​planeco:​roteiro:​07-classr|{{:​planeco:​rlogo.png?​20|}}]] 
-</​WRAP>​ 
- 
-====== Testes Clássicos ====== 
- 
-{{section>​cursos:​planeco:​roteiro:​07-class_base#​testes_classicos}} 
- 
- 
-====== Regressão Linear Simples ====== 
- 
-{{section>​cursos:​planeco:​roteiro:​07-class_base#​regressão_linear_simples}} 
- 
-===== Regressão linear na prática ===== 
- 
-Agora que você entendeu como funciona a regressão linear, vamos para um exemplo prático. 
- 
-Baixe o arquivo de dados para o seu diretório: 
- 
-  * {{ {{ :​cursos:​planeco:​roteiro:​produtividade_chuva.txt | produtividade_chuva.txt}} 
- 
- 
-<WRAP center round info 90%> 
- 
-**Exemplo hipotético** 
- 
- 
- 
- 
-Pesquisadores interessados em entender o efeito da precipitação sobre a produtividade primária liquída em ecossistemas terrestres, selecionaram 30 áreas naturais distribuídas por todo o globo. Dada a importância da água para a fotossíntese,​ a hipótese dos pesquisadores é que quanto maior a precipitação,​ maior seria a produtividade primária líquida do ecossistemas. Em cada área, os pequisadores coletaram duas informações:​ a precipitação anual média (mm) e a produtividade primária líquida (Mg/​ha/​ano). 
- 
- 
- 
-</​WRAP>​ 
- 
- 
- 
-1) Abra o RCommander. Caso vc não tenha instalado o pacote no R, acesse o [[cursos:​planeco:​roteiro:​00-rcmdr|tutorial]] que explica passo à passo como instalar e abrir o RCommander. 
- 
-2) Importe o arquivo para o Rcommander (**Dados > Importar arquivos de dados > de arquivo texto , clipboard, URL...**) e importe os dados //​produtividade_chuva//​. Atenção, pois o Separador de Campos que deve ser selecionado para essa planilha de dados é **Tabs**. 
- 
-3) Conheça os dados, clicando ​ no botão **Ver conjunto de dados** e também em **Estatísticas > Resumos > Conjunto de dados ativo...**. 
- 
-4) Avalie visualmente a relação entre as variáveis com o gráfico de dispersão em: **Gráficos > Diagramas de dispersão (scatterplot)**. Na aba de Opções marque **Boxplots marginais**,​ **Smooth line** e **Mostre espalhamento (spread)**. Como o objetivo dos pesquisadores é analisar o efeito da precipitação sobre a produtividade de plantas, faça o gráfico selecionando produtividade no eixo Y e precipitação no eixo X. 
- 
-5) Ajuste um modelo de regressão linear da produtividade em função da precipitação. Para isso, vá em **Estatística > Ajuste de Modelos > Regressão linear**. Escolha a produtividade como Variável resposta e precipitação como Variável Explicativa. 
- 
-6) No menu **Modelos** podemos olhar o resumo dos resultados do modelo clicando em **Resumir modelo**, olhando os valores dos coeficientes dos modelos. ​ 
- 
-7) Também é possível obter os resíduos e os valores ajustados do modelo clicando no menu **Modelos** em **Adicionar estatísticas calculadas aos dados** e selecionando **Valores ajustados** e **Resíduos**. Esses valores serão colocados como colunas novas na planilha de dados e para visualizá-los,​ basta clicar no botão **Ver conjunto de dados**. 
- 
-==== A hipótese científica foi corroborada?​ ==== 
-Para entender os resultados obtidos, primeiramente devemos examinar o resumo dos resultados. Vcs verão algumas informações relacionadas aos dois parâmetros do modelo: o intercepto e a inclinação (no resumo chamado de "​precipitação"​). Para cada um desses parâmetros há uma estimativa, um erro padrão, um valor de t e um valor de P. Por agora vamos focar apenas na estimativa e em seu p associado. ​ 
- 
-{{ :​cursos:​planeco:​roteiro:​summary_model_chuva.png?​400 |}} 
- 
-Quanto ao **intercepto**,​ vemos que a estimativa feita pelo modelo é de -0.19 e o valor de p é 0.69. Isso significa que quando a precipitação é igual à 0 nosso modelo de regressão estima que a produtividade média dos ecossistemas terretres é de -0.19 MgC/ha/ano. Mas notem que esse valor não é significativamente diferente de zero (como o valor de P=0.69 é maior do que o alfa crítico de 0,05, nós aceitamos H0, a hipótese de que o intercepto é igual a zero). Embora esse resultado possa ser explorado do ponto de vista biológico, lembrem-se que a hipótese científica dos pesquisadores ancora-se na estimativa de b (a inclinação da reta). Então vamos à ela. 
- 
-Quanto à **inclinação**,​ o modelo estimou um valor de 0.003 associado a um p extremamente pequeno (P<​0.00001). Esses resultados indicam que: 
-  * a precipitação afeta de maneira significativa a produtividade primária em Ecossistemas Terrestres (com este valor de P<​0.00001 nós falhamos em aceitar H0 e ficamos com H1, que diz que o B populacional é diferente de 0); Sendo assim, a hipótese científica foi corroborada. 
-  * e com qual magnitude ocorre tal efeito da chuva sobre a produtividade das plantas? Para cada aumento de 1mm na quantidade de chuva média anual de uma localidade observa-se, em média, um aumento em **0.003 MgC/​ha/​ano** na produtividade primária líquida do ecossistema. 
- 
-Adicionalmente temos o valor de **R2 ajustado** para nos ajudar na interpretação do modelo. O R2 ajustado é de 0.80. Isso significa que a variação na precipitação explica aproximadamente 80% da variação observada na produtividade das diferentes localidades. Os demais 20% são explicados por fatores desconhecidos. Mas, lembre-se que R2 de 80% é muito alto e muito raro de ser encontrado na biologia (efeitos da simulação)! 
- 
- 
-==== Premissas do modelo foram atendidas? ==== 
-Para que as conclusões descritas acima sejam confiáveis,​ é preciso checar se as premissas do modelo estão sendo atendidas 
- 
- 
-===Como saber se os erros/​resíduos seguem uma distribuição normal?=== 
-/* 
-{{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_os_erros_residuos_seguem_uma_distribuicao_normal}} 
-*/ 
- 
-Para isso vamos usar os resíduos da regressão que foram incluídos como uma coluna na sua planilha de dados e aparecem com o nome //"​residuals.RegModel.*"//​ (o "​*"​ será um número que vai depender de quantos modelos você já fez até aqui. Por exemplo, se esse é o segundo modelo que você está calculando desde que abriu o Rcommander, a variável vai se chamar "​residuals.RegModel.2"​. Mas não se preocupe com esse número). 
- 
-A partir do menu **Gráficos**,​ escolha **Histograma** e selecione a variável "​residuals.RegModel.*"​. **Essa figura se assemelha a uma distribuição normal?**. Se sim, isso é um bom indício de que seus resíduos têm uma distribuição normal. Se não, será necessário repensar se a regressão linear simples é a análise mais adequada para esses dados e/ou se é necessário fazer alguma transformação de variáveis ((posteriormente falaremos disso)). ​ 
- 
-Essa é uma análise muito simplista e mais para frente nesse roteiro vamos conhecer outros métodos para avaliar a distribuição dos resíduos. ​ 
- 
- 
- 
-=== Como saber se a variância dos erros/​resíduos é constante?​=== 
- 
-{{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_a_variância dos erros_residuos_e_constante?​}} 
- 
-Para fazer esse gráfico, vá para o menu **Gráficos > Diagrama de dispersão**,​ escolha para o eixo Y os resíduos (que foram incluídos na sua planilha de dados como //​residuals.RegModel.*//​) e para o eixo X os valores estimados de Y (que também foram incluídos na sua planilha de dados, como //​fitted.RegModel.*//​). Antes de dar "​OK",​ vá até a aba **Opções** e deixe selecionada apenas a caixa //"​Smooth line"//​. 
- 
-{{section>​cursos:​planeco:​roteiro:​07-class_base#​residuo2}} 
- 
-=== Gráficos Diagnósticos Sintéticos === 
- 
-Para elaborar o conjunto de gráficos diagnósticos do nosso modelo, no RCommander vá em  **Modelos > Gráficos > Diagnósticos gráficos básicos**. 
- 
-{{ :​cursos:​planeco:​roteiro:​diagnostico_chuva.png?​400 |}} 
- 
-{{section>​cursos:​planeco:​roteiro:​07-class_base#​final}} 
- 
  
cursos/planeco/roteiro/07a-clasrcmdr.txt · Última modificação: 2024/03/08 13:01 (edição externa)