Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:07a-clasrcmdr

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Próxima revisão
Revisão anterior
cursos:planeco:roteiro:07a-clasrcmdr [2020/02/27 16:26]
adalardo criada
cursos:planeco:roteiro:07a-clasrcmdr [2024/03/08 12:58]
127.0.0.1 edição externa
Linha 1: Linha 1:
 <WRAP tabs> <WRAP tabs>
-  * [[cursos:​planeco:​roteiro:​07-classrcmdr|{{:​planeco:​logorcmdr01.png?​20|}}]]+  * [[cursos:​planeco:​roteiro:​07a-classrcmdr|{{:​planeco:​logorcmdr01.png?​20|}}]]
   * [[cursos:​planeco:​roteiro:​07-classr|{{:​planeco:​rlogo.png?​20|}}]]   * [[cursos:​planeco:​roteiro:​07-classr|{{:​planeco:​rlogo.png?​20|}}]]
 </​WRAP>​ </​WRAP>​
  
-====== ​Testes Clássicos ​======+====== ​Princípios da Estatística Frequentista ​======
  
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​testes_classicos}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​testes_classicos}}
Linha 13: Linha 13:
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​regressão_linear_simples}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​regressão_linear_simples}}
  
-Agora vamos checar no Rcommander esses mesmos dados: +===== Regressão linear na prática =====
-1) Abra o Rcommander (se você não sabe como fazer isso, [[cursos:​planeco:​roteiro:​00-rcmdr|veja aqui]])+
  
-2) Crie um novo conjunto de dados no menu **Dados > Novo conjunto de dados**. Defina o nome como //dados1//. Preencha ​nova planilha de dados com as informações da figura abaixo e clique OKAgora você já tem os dados para analisar!+Agora que você entendeu ​como funciona ​regressão linear, vamos para um exemplo prático.
  
 +Baixe o arquivo de dados para o seu diretório:
  
-{{ :​planeco:​roteiro:​dados1.png?​400 ​|}}+  * {{ {{ :cursos:​planeco:​roteiro:​produtividade_chuva.txt produtividade_chuva.txt}}
  
-  
-3) Para ajustar um modelo de regressão linear simples vá ao menu **Estatística > Ajuste de Modelos > Regressão Linear...**. Na janela que se abre, escolha a coluna Y dos dados como Variável resposta e a coluna X dos dados como Variável Explicativa e clique OK. 
  
-4) Se tudo correu bem, aparecerá na janela ///​Outputs//​ o resumo dos resultados da regressão. Caso não apareça, vá em **Modelos ​Resumir modelo** e clique em OK((não se preocupe com as opções que aparecem na janela que se abrirá)).+<WRAP center round info 90%>
  
-5) Para visualizar os Y estimados e os resíduos no Rcommander vá em **Modelos > Adicionar estatísticas calculadas aos dados**. Na janela que se abrir, selecione apenas as opções **Valores ajustados** e **Resíduos**. Agora clique no botão **Ver conjunto de dados** e veja as colunas adicionadas. Compare os resultados da regressão feita no Rcommander com os que você calculou a partir do gráfico. ​+**Exemplo hipotético**
  
-==== Checando as premissas ==== 
  
-{{section>​cursos:​planeco:​roteiro:​07-class_base#​checando_as_premissas}} 
  
  
-Importe ​arquivo ​para o Rcommander (**Dados > Importar arquivos de dados > de arquivo texto clipboardURL...**) e importe os dados //algas.peixes//​. Atenção, pois o Separador de Campos que deve ser selecionado para essa planilha de dados é **semicolons [;]**.+Pesquisadores interessados em entender ​efeito da precipitação sobre a produtividade primária liquída em ecossistemas terrestres, selecionaram 30 áreas naturais distribuídas por todo o globo. Dada a importância da água para a fotossíntesea hipótese dos pesquisadores é que quanto maior a precipitaçãomaior será a produtividade primária líquida dos ecossistemasEm cada área, os pequisadores coletaram duas informações:​ a precipitação anual média (mm) e a produtividade primária líquida (Mg/ha/ano).
  
-Conheça os dados, clicando ​ no botão **Ver conjunto de dados** e também em **Estatísticas > Resumos > Conjunto de dados ativo...**. 
  
-Avalie visualmente a relação entre as variáveis com o gráfico de dispersão em: **Gráficos > Diagramas de dispersão**. Na aba de Opções marque **Boxplots marginais**,​ **Smooth line** e **Mostre espalhamento (spread)**. Como o objetivo dos pesquisadores é analisar o efeito da biomassa de algas sobre a biomassa de peixes, faça o gráfico selecionando biomassa de peixes no eixo Y e biomassa de algas no eixo X. 
  
-Ajuste um modelo de regressão linear da biomassa de peixes ​em função da biomassa de algas. Para isso, vá em **Estatística > Ajuste de Modelos > Regressão linear**. Escolha a biomassa de peixe como Variável resposta e biomassa de algas como Variável Explicativa.+</​WRAP>​ 
 + 
 + 
 +==== Hipóteses estatísticas ==== 
 + 
 +Considerando que os pesquisadores estão interessados no efeito da precipitação sobre a produtividade,​ podemos assumir que a precipitação é a variável preditora (x) e a produtividade é a variável resposta (y). Como ambas as variáveis são contínuas, podemos aplicar uma regressão linear simples para testar a hipótese científica. Neste caso, o efeito de precipitação sobre a produtividade será descrito pela inclinação da reta (b). Sendo assim, as hipóteses estatísticas serão: 
 + 
 +  * H0: B=0 
 +  * H1: B≠0 
 + 
 +==== Como fazer a regressão linear simples ==== 
 + 
 +1) Abra o RCommander. Caso vc não tenha instalado o pacote no R, acesse o [[cursos:​planeco:​roteiro:​00-rcmdr|tutorial]] que explica passo à passo como instalar e abrir o RCommander. 
 + 
 +2) Importe o arquivo para o Rcommander (**Dados > Importar arquivos de dados > de arquivo texto , clipboard, URL...**) e importe os dados //​produtividade_chuva//​. Atenção, pois o Separador de Campos que deve ser selecionado para essa planilha de dados é **Tabs**. 
 + 
 +3) Conheça os dados, clicando ​ no botão **Ver conjunto de dados** e também em **Estatísticas > Resumos > Conjunto de dados ativo...**. 
 + 
 +4) Avalie visualmente a relação entre as variáveis com o gráfico de dispersão em: **Gráficos > Diagramas de dispersão (scatterplot)**. Na aba de Opções marque **Boxplots marginais**,​ **Smooth line** e **Mostre espalhamento (spread)**. Como o objetivo dos pesquisadores é analisar o efeito da precipitação sobre a produtividade de plantas, faça o gráfico selecionando produtividade no eixo Y e precipitação no eixo X. 
 + 
 +5) Ajuste um modelo de regressão linear da produtividade ​em função da precipitação. Para isso, vá em **Estatística > Ajuste de Modelos > Regressão linear**. Escolha a produtividade ​como Variável resposta e precipitação ​como Variável Explicativa. 
 + 
 +6) No menu **Modelos** podemos olhar o resumo dos resultados do modelo clicando em **Resumir modelo**, olhando os valores dos coeficientes dos modelos.  
 + 
 +7) Também é possível obter os resíduos e os valores ajustados do modelo clicando no menu **Modelos** em **Adicionar estatísticas calculadas aos dados** e selecionando **Valores ajustados** e **Resíduos**. Esses valores serão colocados como colunas novas na planilha de dados e para visualizá-los,​ basta clicar no botão **Ver conjunto de dados**. 
 + 
 +==== A hipótese científica foi corroborada?​ ==== 
 +Para entender os resultados obtidos, primeiramente devemos examinar o resumo dos resultados. Vcs verão algumas informações relacionadas aos dois parâmetros do modelo: o intercepto e a inclinação (no resumo chamado de "​precipitação"​). Para cada um desses parâmetros há uma estimativa, um erro padrão, um valor de t e um valor de P. Por agora vamos focar apenas na estimativa e em seu p associado.  
 + 
 +{{ :​cursos:​planeco:​roteiro:​summary_model_chuva.png?​400 |}} 
 + 
 +Quanto ao **intercepto**,​ vemos que a estimativa feita pelo modelo é de -0.19 e o valor de p é 0.69. Isso significa que quando a precipitação é igual à 0 nosso modelo de regressão estima que a produtividade média dos ecossistemas terretres será de -0.19 MgC/ha/ano. Mas notem que esse valor não é significativamente diferente de zero (como o valor de P=0.69 é maior do que o alfa crítico de 0.05, nós aceitamos H0, a hipótese de que o intercepto é igual a zero). Embora esse resultado possa ser explorado do ponto de vista biológico, lembrem-se que a hipótese científica dos pesquisadores ancora-se na estimativa de b (a inclinação da reta). Então vamos à ela. 
 + 
 +Quanto à **inclinação**,​ o modelo estimou um valor de 0.003 associado a um p extremamente pequeno (P<​0.00001). Esses resultados indicam que: 
 +  * a precipitação afeta de maneira significativa a produtividade primária em Ecossistemas Terrestres (com este valor de P<​0.00001 nós falhamos em aceitar H0 e ficamos com H1, que diz que o B populacional é diferente de 0); Sendo assim, a hipótese científica foi corroborada. 
 +  * e com qual magnitude ocorre tal efeito da chuva sobre a produtividade das plantas? Para cada aumento de 1mm na quantidade de chuva média anual de uma localidade observa-se, em média, um aumento em **0.003 MgC/​ha/​ano** na produtividade primária líquida dos ecossistemas. 
 + 
 +Adicionalmente temos o valor de **R2 ajustado** para nos ajudar na interpretação do modelo. O R2 ajustado é de 0.80. Isso significa que a variação na precipitação explica aproximadamente 80% da variação observada na produtividade das diferentes localidades. Os demais 20% são explicados por fatores desconhecidos. Mas, lembre-se que R2 de 80% é muito alto e muito raro de ser encontrado na biologia (efeitos da simulação)! 
 + 
 + 
 +==== As premissas do modelo foram atendidas? ==== 
 +Para que as conclusões descritas acima sejam confiáveis,​ é preciso checar se as premissas do modelo estão sendo atendidas
  
-No menu **Modelos** podemos olhar o resumo dos resultados do modelo clicando em **Resumir modelo**, olhando os valores dos coeficientes dos modelos. Como vimos anteriormente,​ podemos também obter os resíduos e os valores ajustados do modelo clicando em **Adicionar estatísticas calculadas aos dados** e selecionando **Valores ajustados** e **Resíduos**. Esses valores serão colocados como colunas novas na planilha de dados e para visualizá-los,​ basta clicar no botão **Ver conjunto de dados**. 
  
-====Como saber se os erros/​resíduos seguem uma distribuição normal?====+===Como saber se os erros/​resíduos seguem uma distribuição normal?===
 /* /*
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_os_erros_residuos_seguem_uma_distribuicao_normal}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_os_erros_residuos_seguem_uma_distribuicao_normal}}
Linha 56: Linha 90:
  
  
-==== Como saber se a variância dos erros/​resíduos é constante?====+=== Como saber se a variância dos erros/​resíduos é constante?​===
  
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_a_variância dos erros_residuos_e_constante?​}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_a_variância dos erros_residuos_e_constante?​}}
Linha 64: Linha 98:
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​residuo2}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​residuo2}}
  
-Vá ao menu **Modelos > Resumir modelos**.+=== Gráficos Diagnósticos Sintéticos ===
  
-Agora, vamos definir que sejam construídos os 4 gráficos ​de diagnóstico:​ Vá ao menu **Modelos > Gráficos > Diagnósticos gráficos básicos**.+Para elaborar o conjunto ​de gráficos diagnósticos do nosso modelo, no RCommander vá em  ​**Modelos > Gráficos > Diagnósticos gráficos básicos**.
  
-{{ :​planeco:​roteiro:​plotdiagnostico.png?500 |}}+{{ :cursos:​planeco:​roteiro:​diagnostico_chuva.png?400 |}}
  
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​final}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​final}}
  
  
cursos/planeco/roteiro/07a-clasrcmdr.txt · Última modificação: 2024/03/08 13:01 (edição externa)