Aqui você vê as diferenças entre duas revisões dessa página.
Próxima revisão | Revisão anterior | ||
cursos:planeco:roteiro:07a-clasrcmdr [2020/02/27 16:26] adalardo criada |
cursos:planeco:roteiro:07a-clasrcmdr [2024/03/08 12:58] 127.0.0.1 edição externa |
||
---|---|---|---|
Linha 1: | Linha 1: | ||
<WRAP tabs> | <WRAP tabs> | ||
- | * [[cursos:planeco:roteiro:07-classrcmdr|{{:planeco:logorcmdr01.png?20|}}]] | + | * [[cursos:planeco:roteiro:07a-classrcmdr|{{:planeco:logorcmdr01.png?20|}}]] |
* [[cursos:planeco:roteiro:07-classr|{{:planeco:rlogo.png?20|}}]] | * [[cursos:planeco:roteiro:07-classr|{{:planeco:rlogo.png?20|}}]] | ||
</WRAP> | </WRAP> | ||
- | ====== Testes Clássicos ====== | + | ====== Princípios da Estatística Frequentista ====== |
{{section>cursos:planeco:roteiro:07-class_base#testes_classicos}} | {{section>cursos:planeco:roteiro:07-class_base#testes_classicos}} | ||
Linha 13: | Linha 13: | ||
{{section>cursos:planeco:roteiro:07-class_base#regressão_linear_simples}} | {{section>cursos:planeco:roteiro:07-class_base#regressão_linear_simples}} | ||
- | Agora vamos checar no Rcommander esses mesmos dados: | + | ===== Regressão linear na prática ===== |
- | 1) Abra o Rcommander (se você não sabe como fazer isso, [[cursos:planeco:roteiro:00-rcmdr|veja aqui]]) | + | |
- | 2) Crie um novo conjunto de dados no menu **Dados > Novo conjunto de dados**. Defina o nome como //dados1//. Preencha a nova planilha de dados com as informações da figura abaixo e clique OK. Agora você já tem os dados para analisar! | + | Agora que você entendeu como funciona a regressão linear, vamos para um exemplo prático. |
+ | Baixe o arquivo de dados para o seu diretório: | ||
- | {{ :planeco:roteiro:dados1.png?400 |}} | + | * {{ {{ :cursos:planeco:roteiro:produtividade_chuva.txt | produtividade_chuva.txt}} |
- | |||
- | 3) Para ajustar um modelo de regressão linear simples vá ao menu **Estatística > Ajuste de Modelos > Regressão Linear...**. Na janela que se abre, escolha a coluna Y dos dados como Variável resposta e a coluna X dos dados como Variável Explicativa e clique OK. | ||
- | 4) Se tudo correu bem, aparecerá na janela ///Outputs// o resumo dos resultados da regressão. Caso não apareça, vá em **Modelos > Resumir modelo** e clique em OK((não se preocupe com as opções que aparecem na janela que se abrirá)). | + | <WRAP center round info 90%> |
- | 5) Para visualizar os Y estimados e os resíduos no Rcommander vá em **Modelos > Adicionar estatísticas calculadas aos dados**. Na janela que se abrir, selecione apenas as opções **Valores ajustados** e **Resíduos**. Agora clique no botão **Ver conjunto de dados** e veja as colunas adicionadas. Compare os resultados da regressão feita no Rcommander com os que você calculou a partir do gráfico. | + | **Exemplo hipotético** |
- | ==== Checando as premissas ==== | ||
- | {{section>cursos:planeco:roteiro:07-class_base#checando_as_premissas}} | ||
- | Importe o arquivo para o Rcommander (**Dados > Importar arquivos de dados > de arquivo texto , clipboard, URL...**) e importe os dados //algas.peixes//. Atenção, pois o Separador de Campos que deve ser selecionado para essa planilha de dados é **semicolons [;]**. | + | Pesquisadores interessados em entender o efeito da precipitação sobre a produtividade primária liquída em ecossistemas terrestres, selecionaram 30 áreas naturais distribuídas por todo o globo. Dada a importância da água para a fotossíntese, a hipótese dos pesquisadores é que quanto maior a precipitação, maior será a produtividade primária líquida dos ecossistemas. Em cada área, os pequisadores coletaram duas informações: a precipitação anual média (mm) e a produtividade primária líquida (Mg/ha/ano). |
- | Conheça os dados, clicando no botão **Ver conjunto de dados** e também em **Estatísticas > Resumos > Conjunto de dados ativo...**. | ||
- | Avalie visualmente a relação entre as variáveis com o gráfico de dispersão em: **Gráficos > Diagramas de dispersão**. Na aba de Opções marque **Boxplots marginais**, **Smooth line** e **Mostre espalhamento (spread)**. Como o objetivo dos pesquisadores é analisar o efeito da biomassa de algas sobre a biomassa de peixes, faça o gráfico selecionando biomassa de peixes no eixo Y e biomassa de algas no eixo X. | ||
- | Ajuste um modelo de regressão linear da biomassa de peixes em função da biomassa de algas. Para isso, vá em **Estatística > Ajuste de Modelos > Regressão linear**. Escolha a biomassa de peixe como Variável resposta e biomassa de algas como Variável Explicativa. | + | </WRAP> |
+ | |||
+ | |||
+ | ==== Hipóteses estatísticas ==== | ||
+ | |||
+ | Considerando que os pesquisadores estão interessados no efeito da precipitação sobre a produtividade, podemos assumir que a precipitação é a variável preditora (x) e a produtividade é a variável resposta (y). Como ambas as variáveis são contínuas, podemos aplicar uma regressão linear simples para testar a hipótese científica. Neste caso, o efeito de precipitação sobre a produtividade será descrito pela inclinação da reta (b). Sendo assim, as hipóteses estatísticas serão: | ||
+ | |||
+ | * H0: B=0 | ||
+ | * H1: B≠0 | ||
+ | |||
+ | ==== Como fazer a regressão linear simples ==== | ||
+ | |||
+ | 1) Abra o RCommander. Caso vc não tenha instalado o pacote no R, acesse o [[cursos:planeco:roteiro:00-rcmdr|tutorial]] que explica passo à passo como instalar e abrir o RCommander. | ||
+ | |||
+ | 2) Importe o arquivo para o Rcommander (**Dados > Importar arquivos de dados > de arquivo texto , clipboard, URL...**) e importe os dados //produtividade_chuva//. Atenção, pois o Separador de Campos que deve ser selecionado para essa planilha de dados é **Tabs**. | ||
+ | |||
+ | 3) Conheça os dados, clicando no botão **Ver conjunto de dados** e também em **Estatísticas > Resumos > Conjunto de dados ativo...**. | ||
+ | |||
+ | 4) Avalie visualmente a relação entre as variáveis com o gráfico de dispersão em: **Gráficos > Diagramas de dispersão (scatterplot)**. Na aba de Opções marque **Boxplots marginais**, **Smooth line** e **Mostre espalhamento (spread)**. Como o objetivo dos pesquisadores é analisar o efeito da precipitação sobre a produtividade de plantas, faça o gráfico selecionando produtividade no eixo Y e precipitação no eixo X. | ||
+ | |||
+ | 5) Ajuste um modelo de regressão linear da produtividade em função da precipitação. Para isso, vá em **Estatística > Ajuste de Modelos > Regressão linear**. Escolha a produtividade como Variável resposta e precipitação como Variável Explicativa. | ||
+ | |||
+ | 6) No menu **Modelos** podemos olhar o resumo dos resultados do modelo clicando em **Resumir modelo**, olhando os valores dos coeficientes dos modelos. | ||
+ | |||
+ | 7) Também é possível obter os resíduos e os valores ajustados do modelo clicando no menu **Modelos** em **Adicionar estatísticas calculadas aos dados** e selecionando **Valores ajustados** e **Resíduos**. Esses valores serão colocados como colunas novas na planilha de dados e para visualizá-los, basta clicar no botão **Ver conjunto de dados**. | ||
+ | |||
+ | ==== A hipótese científica foi corroborada? ==== | ||
+ | Para entender os resultados obtidos, primeiramente devemos examinar o resumo dos resultados. Vcs verão algumas informações relacionadas aos dois parâmetros do modelo: o intercepto e a inclinação (no resumo chamado de "precipitação"). Para cada um desses parâmetros há uma estimativa, um erro padrão, um valor de t e um valor de P. Por agora vamos focar apenas na estimativa e em seu p associado. | ||
+ | |||
+ | {{ :cursos:planeco:roteiro:summary_model_chuva.png?400 |}} | ||
+ | |||
+ | Quanto ao **intercepto**, vemos que a estimativa feita pelo modelo é de -0.19 e o valor de p é 0.69. Isso significa que quando a precipitação é igual à 0 nosso modelo de regressão estima que a produtividade média dos ecossistemas terretres será de -0.19 MgC/ha/ano. Mas notem que esse valor não é significativamente diferente de zero (como o valor de P=0.69 é maior do que o alfa crítico de 0.05, nós aceitamos H0, a hipótese de que o intercepto é igual a zero). Embora esse resultado possa ser explorado do ponto de vista biológico, lembrem-se que a hipótese científica dos pesquisadores ancora-se na estimativa de b (a inclinação da reta). Então vamos à ela. | ||
+ | |||
+ | Quanto à **inclinação**, o modelo estimou um valor de 0.003 associado a um p extremamente pequeno (P<0.00001). Esses resultados indicam que: | ||
+ | * a precipitação afeta de maneira significativa a produtividade primária em Ecossistemas Terrestres (com este valor de P<0.00001 nós falhamos em aceitar H0 e ficamos com H1, que diz que o B populacional é diferente de 0); Sendo assim, a hipótese científica foi corroborada. | ||
+ | * e com qual magnitude ocorre tal efeito da chuva sobre a produtividade das plantas? Para cada aumento de 1mm na quantidade de chuva média anual de uma localidade observa-se, em média, um aumento em **0.003 MgC/ha/ano** na produtividade primária líquida dos ecossistemas. | ||
+ | |||
+ | Adicionalmente temos o valor de **R2 ajustado** para nos ajudar na interpretação do modelo. O R2 ajustado é de 0.80. Isso significa que a variação na precipitação explica aproximadamente 80% da variação observada na produtividade das diferentes localidades. Os demais 20% são explicados por fatores desconhecidos. Mas, lembre-se que R2 de 80% é muito alto e muito raro de ser encontrado na biologia (efeitos da simulação)! | ||
+ | |||
+ | |||
+ | ==== As premissas do modelo foram atendidas? ==== | ||
+ | Para que as conclusões descritas acima sejam confiáveis, é preciso checar se as premissas do modelo estão sendo atendidas | ||
- | No menu **Modelos** podemos olhar o resumo dos resultados do modelo clicando em **Resumir modelo**, olhando os valores dos coeficientes dos modelos. Como vimos anteriormente, podemos também obter os resíduos e os valores ajustados do modelo clicando em **Adicionar estatísticas calculadas aos dados** e selecionando **Valores ajustados** e **Resíduos**. Esses valores serão colocados como colunas novas na planilha de dados e para visualizá-los, basta clicar no botão **Ver conjunto de dados**. | ||
- | ====Como saber se os erros/resíduos seguem uma distribuição normal?==== | + | ===Como saber se os erros/resíduos seguem uma distribuição normal?=== |
/* | /* | ||
{{section>cursos:planeco:roteiro:07-class_base#como_saber_se_os_erros_residuos_seguem_uma_distribuicao_normal}} | {{section>cursos:planeco:roteiro:07-class_base#como_saber_se_os_erros_residuos_seguem_uma_distribuicao_normal}} | ||
Linha 56: | Linha 90: | ||
- | ==== Como saber se a variância dos erros/resíduos é constante?==== | + | === Como saber se a variância dos erros/resíduos é constante?=== |
{{section>cursos:planeco:roteiro:07-class_base#como_saber_se_a_variância dos erros_residuos_e_constante?}} | {{section>cursos:planeco:roteiro:07-class_base#como_saber_se_a_variância dos erros_residuos_e_constante?}} | ||
Linha 64: | Linha 98: | ||
{{section>cursos:planeco:roteiro:07-class_base#residuo2}} | {{section>cursos:planeco:roteiro:07-class_base#residuo2}} | ||
- | Vá ao menu **Modelos > Resumir modelos**. | + | === Gráficos Diagnósticos Sintéticos === |
- | Agora, vamos definir que sejam construídos os 4 gráficos de diagnóstico: Vá ao menu **Modelos > Gráficos > Diagnósticos gráficos básicos**. | + | Para elaborar o conjunto de gráficos diagnósticos do nosso modelo, no RCommander vá em **Modelos > Gráficos > Diagnósticos gráficos básicos**. |
- | {{ :planeco:roteiro:plotdiagnostico.png?500 |}} | + | {{ :cursos:planeco:roteiro:diagnostico_chuva.png?400 |}} |
{{section>cursos:planeco:roteiro:07-class_base#final}} | {{section>cursos:planeco:roteiro:07-class_base#final}} | ||