Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:07a-clasrcmdr

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Próxima revisão
Revisão anterior
cursos:planeco:roteiro:07a-clasrcmdr [2020/02/27 16:26]
adalardo criada
cursos:planeco:roteiro:07a-clasrcmdr [2024/03/08 13:01] (atual)
Linha 1: Linha 1:
-<WRAP tabs> 
-  * [[cursos:​planeco:​roteiro:​07-classrcmdr|{{:​planeco:​logorcmdr01.png?​20|}}]] 
-  * [[cursos:​planeco:​roteiro:​07-classr|{{:​planeco:​rlogo.png?​20|}}]] 
-</​WRAP>​ 
  
-====== ​Testes Clássicos ​======+====== ​Princípios da Estatística Frequentista ​======
  
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​testes_classicos}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​testes_classicos}}
Linha 13: Linha 9:
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​regressão_linear_simples}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​regressão_linear_simples}}
  
-Agora vamos checar no Rcommander esses mesmos ​dados: +===== Regressão linear na prática ===== 
-1) Abra o Rcommander (se você não sabe como fazer isso, [[cursos:​planeco:​roteiro:​00-rcmdr|veja aqui]])+ 
 +Agora que você entendeu como funciona a regressão linear, ​vamos para um exemplo prático. 
 + 
 +Baixe o arquivo de dados para o seu diretório: 
 + 
 +  * {{ {{ :​cursos:​planeco:​roteiro:​produtividade_chuva.txt | produtividade_chuva.txt}} 
 + 
 + 
 +<WRAP center round info 90%> 
 + 
 +**Exemplo hipotético** 
 + 
 + 
 + 
 + 
 +Pesquisadores interessados em entender o efeito da precipitação sobre a produtividade primária liquída em ecossistemas terrestres, selecionaram 30 áreas naturais distribuídas por todo o globo. Dada a importância da água para a fotossíntese,​ a hipótese dos pesquisadores é que quanto maior a precipitação,​ maior será a produtividade primária líquida dos ecossistemas. Em cada área, os pequisadores coletaram duas informações:​ a precipitação anual média (mm) e a produtividade primária líquida (Mg/​ha/​ano). 
 + 
 + 
 + 
 +</​WRAP>​ 
 + 
 + 
 +==== Hipóteses estatísticas ==== 
 + 
 +Considerando que os pesquisadores estão interessados no efeito da precipitação sobre a produtividade,​ podemos assumir que a precipitação é a variável preditora (x) e a produtividade é a variável resposta (y). Como ambas as variáveis são contínuas, podemos aplicar uma regressão linear simples para testar a hipótese científica. Neste caso, o efeito de precipitação sobre a produtividade será descrito pela inclinação da reta (b). Sendo assim, as hipóteses estatísticas serão: 
 + 
 +  * H0: B=0 
 +  * H1: B≠0 
 + 
 +==== Como fazer a regressão linear simples ==== 
 + 
 +1) Abra o RCommander. Caso vc não tenha instalado o pacote no Racesse o [[cursos:​planeco:​roteiro:​00-rcmdr|tutorial]] que explica passo à passo como instalar e abrir o RCommander.
  
-2) Crie um novo conjunto de dados no menu **Dados > Novo conjunto ​de dados**. Defina o nome como //dados1//. Preencha a nova planilha de dados com as informações da figura abaixo e clique OKAgora você já tem os dados para analisar!+2) Importe o arquivo para o Rcommander (**Dados > Importar arquivos ​de dados > de arquivo texto , clipboard, URL...**) e importe os dados //produtividade_chuva//. Atenção, pois o Separador de Campos que deve ser selecionado para essa planilha de dados é **Tabs**.
  
 +3) Conheça os dados, clicando ​ no botão **Ver conjunto de dados** e também em **Estatísticas > Resumos > Conjunto de dados ativo...**.
  
-{{ :planeco:​roteiro:​dados1.png?400 |}}+4) Avalie visualmente a relação entre as variáveis com o gráfico de dispersão em**Gráficos > Diagramas de dispersão (scatterplot)**. Na aba de Opções marque **Boxplots marginais**,​ **Smooth line** e **Mostre espalhamento (spread)**. Como o objetivo dos pesquisadores é analisar o efeito da precipitação sobre a produtividade de plantas, faça o gráfico selecionando produtividade no eixo Y e precipitação no eixo X.
  
-  +5Ajuste ​um modelo de regressão linear ​da produtividade em função da precipitação. Para isso, vá em **Estatística > Ajuste de Modelos > Regressão ​linear**. Escolha ​produtividade ​como Variável resposta e precipitação ​como Variável Explicativa.
-3Para ajustar ​um modelo de regressão linear ​simples ​vá ao menu **Estatística > Ajuste de Modelos > Regressão ​Linear...**. Na janela que se abre, escolha ​coluna Y dos dados como Variável resposta e a coluna X dos dados como Variável Explicativa ​e clique OK.+
  
-4Se tudo correu bem, aparecerá na janela ///​Outputs// ​o resumo dos resultados ​da regressão. Caso não apareça, vá em **Modelos > Resumir modelo** ​e clique em OK((não se preocupe com as opções que aparecem na janela que se abrirá)).+6No menu **Modelos** podemos olhar o resumo dos resultados ​do modelo clicando ​em **Resumir modelo**, olhando os valores dos coeficientes dos modelos
  
-5Para visualizar ​os Y estimados ​e os resíduos ​no Rcommander vá em **Modelos ​Adicionar estatísticas calculadas aos dados**. Na janela que se abrir, selecione apenas as opções ​**Valores ajustados** e **Resíduos**. ​Agora clique ​no botão **Ver conjunto de dados** ​e veja as colunas adicionadas. Compare os resultados da regressão feita no Rcommander com os que você calculou a partir do gráfico+7Também é possível obter os resíduos ​e os valores ajustados do modelo clicando ​no menu **Modelos** em **Adicionar estatísticas calculadas aos dados** ​e selecionando ​**Valores ajustados** e **Resíduos**. ​Esses valores serão colocados como colunas novas na planilha de dados e para visualizá-los,​ basta clicar ​no botão **Ver conjunto de dados**.
  
-==== Checando as premissas ​====+==== A hipótese científica foi corroborada? ​==== 
 +Para entender os resultados obtidos, primeiramente devemos examinar o resumo dos resultados. Vcs verão algumas informações relacionadas aos dois parâmetros do modelo: o intercepto e a inclinação (no resumo chamado de "​precipitação"​). Para cada um desses parâmetros há uma estimativa, um erro padrão, um valor de t e um valor de P. Por agora vamos focar apenas na estimativa e em seu p associado. ​
  
-{{section>cursos:​planeco:​roteiro:​07-class_base#​checando_as_premissas}}+{{ :cursos:​planeco:​roteiro:​summary_model_chuva.png?​400 |}}
  
 +Quanto ao **intercepto**,​ vemos que a estimativa feita pelo modelo é de -0.19 e o valor de p é 0.69. Isso significa que quando a precipitação é igual à 0 nosso modelo de regressão estima que a produtividade média dos ecossistemas terretres será de -0.19 MgC/ha/ano. Mas notem que esse valor não é significativamente diferente de zero (como o valor de P=0.69 é maior do que o alfa crítico de 0.05, nós aceitamos H0, a hipótese de que o intercepto é igual a zero). Embora esse resultado possa ser explorado do ponto de vista biológico, lembrem-se que a hipótese científica dos pesquisadores ancora-se na estimativa de b (a inclinação da reta). Então vamos à ela.
  
-Importe o arquivo para o Rcommander (**Dados > Importar arquivos de dados > de arquivo texto clipboard, URL...**) e importe os dados //algas.peixes//. Atençãopois Separador ​de Campos que deve ser selecionado para essa planilha ​de dados é **semicolons [;]**.+Quanto à **inclinação**, o modelo estimou um valor de 0.003 associado a um p extremamente pequeno (P<0.00001)Esses resultados indicam que: 
 +  ​a precipitação afeta de maneira significativa a produtividade primária em Ecossistemas Terrestres (com este valor de P<0.00001 nós falhamos em aceitar H0 e ficamos com H1que diz que B populacional é diferente ​de 0); Sendo assim, a hipótese científica foi corroborada. 
 +  * e com qual magnitude ocorre tal efeito da chuva sobre a produtividade das plantas? Para cada aumento ​de 1mm na quantidade de chuva média anual de uma localidade observa-se, em média, um aumento em **0.003 MgC/ha/ano** na produtividade primária líquida dos ecossistemas.
  
-Conheça os dados, clicando ​ no botão **Ver conjunto ​de dados** e também em **Estatísticas > Resumos > Conjunto ​de dados ativo...**.+Adicionalmente temos o valor de **R2 ajustado** para nos ajudar na interpretação do modelo. O R2 ajustado é de 0.80Isso significa que a variação na precipitação explica aproximadamente 80% da variação observada na produtividade das diferentes localidadesOs demais 20% são explicados por fatores desconhecidosMas, lembre-se que R2 de 80% é muito alto e muito raro de ser encontrado na biologia (efeitos da simulação)!
  
-Avalie visualmente a relação entre as variáveis com o gráfico de dispersão em: **Gráficos > Diagramas de dispersão**. Na aba de Opções marque **Boxplots marginais**,​ **Smooth line** e **Mostre espalhamento (spread)**. Como o objetivo dos pesquisadores é analisar o efeito da biomassa de algas sobre a biomassa de peixes, faça o gráfico selecionando biomassa de peixes no eixo Y e biomassa de algas no eixo X. 
  
-Ajuste um modelo ​de regressão linear da biomassa de peixes em função da biomassa de algas. ​Para issová em **Estatística > Ajuste de Modelos > Regressão linear**. Escolha a biomassa de peixe como Variável resposta e biomassa de algas como Variável Explicativa.+==== As premissas do modelo ​foram atendidas? ==== 
 +Para que as conclusões descritas acima sejam confiáveisé preciso checar se as premissas do modelo estão sendo atendidas
  
-No menu **Modelos** podemos olhar o resumo dos resultados do modelo clicando em **Resumir modelo**, olhando os valores dos coeficientes dos modelos. Como vimos anteriormente,​ podemos também obter os resíduos e os valores ajustados do modelo clicando em **Adicionar estatísticas calculadas aos dados** e selecionando **Valores ajustados** e **Resíduos**. Esses valores serão colocados como colunas novas na planilha de dados e para visualizá-los,​ basta clicar no botão **Ver conjunto de dados**. 
  
-====Como saber se os erros/​resíduos seguem uma distribuição normal?====+===Como saber se os erros/​resíduos seguem uma distribuição normal?===
 /* /*
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_os_erros_residuos_seguem_uma_distribuicao_normal}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_os_erros_residuos_seguem_uma_distribuicao_normal}}
Linha 56: Linha 86:
  
  
-==== Como saber se a variância dos erros/​resíduos é constante?====+=== Como saber se a variância dos erros/​resíduos é constante?​===
  
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_a_variância dos erros_residuos_e_constante?​}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​como_saber_se_a_variância dos erros_residuos_e_constante?​}}
Linha 64: Linha 94:
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​residuo2}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​residuo2}}
  
-Vá ao menu **Modelos > Resumir modelos**.+=== Gráficos Diagnósticos Sintéticos ===
  
-Agora, vamos definir que sejam construídos os 4 gráficos ​de diagnóstico:​ Vá ao menu **Modelos > Gráficos > Diagnósticos gráficos básicos**.+Para elaborar o conjunto ​de gráficos diagnósticos do nosso modelo, no RCommander vá em  ​**Modelos > Gráficos > Diagnósticos gráficos básicos**.
  
-{{ :​planeco:​roteiro:​plotdiagnostico.png?500 |}}+{{ :cursos:​planeco:​roteiro:​diagnostico_chuva.png?400 |}}
  
 {{section>​cursos:​planeco:​roteiro:​07-class_base#​final}} {{section>​cursos:​planeco:​roteiro:​07-class_base#​final}}
  
  
cursos/planeco/roteiro/07a-clasrcmdr.1582831616.txt.gz · Última modificação: 2020/02/27 16:26 por adalardo