Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
cursos:planeco:roteiro:07-class_base [2022/03/28 16:57] adalardo [Tabela de ANOVA] |
cursos:planeco:roteiro:07-class_base [2024/02/26 18:02] (atual) |
||
---|---|---|---|
Linha 3: | Linha 3: | ||
====== Testes Clássicos ====== | ====== Testes Clássicos ====== | ||
- | Os testes clássicos estatísticos estão inseridos no escopo da estatística frequentista ou inferência frequentista. Nessa abordagem a inferência é baseada na frequência ou proporção dos dados amostrados. | + | Os testes clássicos estatísticos estão inseridos no escopo da estatística frequentista ou inferência frequentista. Nessa abordagem a probabilidade é considerada uma frequência e a inferencia está baseada na frequência com que eventos ocorrem nos dados coletados. |
/* | /* | ||
Linha 22: | Linha 22: | ||
====== Anova ====== | ====== Anova ====== | ||
- | |||
- | Antes de iniciar o roteiro, assista a aula gravada no nosso canal do Youtube. | ||
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
**//__Aula Gravada - Anova: Partição da Variaçao__//** | **//__Aula Gravada - Anova: Partição da Variaçao__//** | ||
+ | |||
+ | |||
+ | Esssa video aula foi gravada durante a pandemia e permanece aqui como material de referência e consulta | ||
+ | |||
{{ youtube>pQ5E6YXQR5I |}} | {{ youtube>pQ5E6YXQR5I |}} | ||
</WRAP> | </WRAP> | ||
Linha 32: | Linha 34: | ||
- | Na aula sobre [[cursos:planeco:roteiro:02-hipot|teste de hipótese]] utilizamos técnicas de Monte Carlo para testar a hipótese de que duas médias são distintas, ou que uma é maior/menor que outra, tanto no exemplo do [[cursos:planeco:roteiro:02-hipot#Tutorial Árvores do Mangue|]], quanto no exercício [[cursos:planeco:roteiro:02-hipot#Exercício| Altura dos alunos]]. Em ambos os casos estávamos comparando médias de dois grupos distintos, por exemplo, dois tipos de solos no mangue ou gênero dos alunos. O nosso procedimento foi análogo ao teste frequentista **//t// de Student**, mas a forma de obter o //**p-valor**// foi diferente. Nos procedimentos anteriores, simulamos o cenário nulo e comparamos o valor observado (diferença das médias) com a distribuição de probabilidades obtidas por meio dessa simulação. Na abordagem __clássica__ do teste frequentista **//t// de Student**, o valor observado (diferença das médias) é comparado com uma distribuição estatística //**t**// conhecida previamente, que foi desenvolvida pelo matemático William Gosset. | + | Na aula sobre [[cursos:planeco:roteiro:02-hipot|teste de hipótese]] utilizamos técnicas de Monte Carlo para testar a hipótese de que duas médias são distintas, ou que uma é maior/menor que outra, tanto no exemplo do [[cursos:planeco:roteiro:02-hipot#Tutorial Árvores do Mangue|]], quanto no exercício [[cursos:planeco:roteiro:02-hipot#Exercício| Altura dos alunos]]. Em ambos os casos estávamos comparando médias de dois grupos distintos, por exemplo, dois tipos de solos no mangue ou gênero dos alunos. O nosso procedimento foi análogo ao teste frequentista **//t// de Student**, mas a forma de obter o //**p-valor**// foi diferente. Nos procedimentos anteriores, simulamos o cenário nulo e comparamos o valor observado (diferença das médias) com a distribuição de probabilidades obtidas por meio dessa simulação. Na abordagem __clássica__ do teste frequentista **//t// de Student**, a estatística de interesse //t// da amostra é comparada com a distribuição probabilística //**t**// , desenvolvida pelo matemático britânico William Gosset. |
<WRAP center round important 70%> | <WRAP center round important 70%> | ||
Linha 40: | Linha 42: | ||
- | A //Análise de Variância// (** ANOVA **) é uma generalização do teste **//t// de Student**, desenvolvida por [[https://en.wikipedia.org/wiki/Ronald_Fisher|Ronald Fisher]] há mais de 100 anos (1918). Apesar de idoso, é um teste muito popular, talvez o mais utilizado em ciências naturais. A hipótese subjacente da ANOVA é de diferença entre as médias de 2 ou mais grupos. O procedimento para o cálculo da estatística da ANOVA, chamada de **//F//**, está associado à partição da variância dos dados, por isso o nome. Uma maneira clássica de apresentar o resultado do teste de **ANOVA** é a a chamada **tabela de ANOVA**. Tanto a partição da variação quanto a **tabela de ANOVA** serão utilizados para avaliarmos outros modelos durante o curso, por isso é importante entender bem o que é a partição da variação e o que a tabela de ANOVA nos apresenta. | + | A //Análise de Variância// (** ANOVA **), desenvolvida pelo também britânico [[https://en.wikipedia.org/wiki/Ronald_Fisher|Ronald Fisher]] há mais de 100 anos (1918), é uma generalização do teste **//t// de Student**. Apesar da idade avançada, é um teste muito popular, talvez o mais utilizado em ciências naturais nas últimas décadas. A hipótese subjacente da ANOVA é de diferença entre as médias de 2 ou mais grupos. O procedimento para o cálculo da estatística da ANOVA, chamada de **//F//**, está associado à partição da variância dos dados, por isso o nome. Uma maneira clássica de apresentar o resultado do teste de **ANOVA** é a a chamada **tabela de ANOVA**. Tanto a partição da variação quanto a **tabela de ANOVA** serão utilizados para avaliarmos outros modelos durante o curso, por isso é importante entender bem o que é a partição da variação e o que a tabela de ANOVA nos apresenta. |
\\ | \\ | ||
Linha 184: | Linha 186: | ||
<WRAP center round tip 70%> | <WRAP center round tip 70%> | ||
**__Como calcular o p-valor a partir do F __** | **__Como calcular o p-valor a partir do F __** | ||
- | * A função //DIST.F// no Excel ou LibreOffice calcula o p-valor a partir da estatística **F** e graus de liberdade; | + | * A função ''DIST.F'' no Excel ou LibreOffice calcula o p-valor a partir da estatística **F** e graus de liberdade; |
* usualmente a função recebe o valor de **F**, seguido dos graus de liberdade entre e intra grupos; | * usualmente a função recebe o valor de **F**, seguido dos graus de liberdade entre e intra grupos; | ||
- | * o resultado da função //DIST.F// é a probabilidade cumulativa; | + | * normalmente o resultado da função ''DIST.F'' é a probabilidade cumulativa, mas fique atento, pode ser a densidade probabilística, dependendo do padrão do Excel. Consulte a documentação do [[https://support.microsoft.com/pt-br/office/dist-f-fun%C3%A7%C3%A3o-dist-f-a887efdc-7c8e-46cb-a74a-f884cd29b25d|''DIST.F'' do Excel]] caso tenha dúvida; |
- | * o p-valor é igual a 1 menos essa probabilidade. | + | * no caso do valor retornado seja a probabilidade cumulativa, o p-valor é igual a 1 menos essa probabilidade ((a densidade probabilística não permite o cálculo do p-valor, portanto, é preciso calcular a probabilidade cumulativa e subtrair de um para o cálculo do p-valor)). |
</WRAP> | </WRAP> | ||
Linha 193: | Linha 195: | ||
<WRAP center round tip 70%> | <WRAP center round tip 70%> | ||
+ | |||
**__ ANOVA no Rcmdr __** | **__ ANOVA no Rcmdr __** | ||
* importe os dados apenas com as colunas de dados brutos; | * importe os dados apenas com as colunas de dados brutos; | ||
- | * o menu //Estatísticas// está separado em tipos de estatísticas e qual o parâmetro associado ao teste de hipótese estatístico; | + | * o menu ''Statistics'' está separado em tipos de estatísticas e qual o parâmetro associado ao teste de hipótese estatístico; |
- | * o nosso teste é sobre médias, portanto no sub-menu //Médias//; | + | * o nosso teste é sobre médias, portanto no sub-menu ''Mean''; |
- | * nele há a opção ``Multi-way ANOVA``...// | + | * nele há a opção ''Multi-way ANOVA''... |
* o resultado aparecerá na janela //Output//. | * o resultado aparecerá na janela //Output//. | ||
+ | |||
</WRAP> | </WRAP> | ||
Linha 235: | Linha 239: | ||
\\ | \\ | ||
\\ | \\ | ||
- | Inclua os seguintes produtos no formulário a seguir ou pelo [[https://docs.google.com/forms/d/e/1FAIpQLSdFL6jKLBe9YmbRlQI9MD04Swl8vPWZHGjxXlZSXulerfT2DA/viewform?usp=pp_url| link do formulário]] | + | Inclua os seguintes produtos no formulário abaixo: |
+ | * [[https://docs.google.com/forms/d/e/1FAIpQLSdklx8YfIE31Cp7t2IsN2TL_6m-gChiu6KoAMyIu7RNBJiZaA/viewform?usp=sf_link| link do formulário]] | ||
1) Para os dados de solos e produtividade (Crawley, 2007): | 1) Para os dados de solos e produtividade (Crawley, 2007): | ||
Linha 250: | Linha 255: | ||
</WRAP> | </WRAP> | ||
- | |||
- | |||
- | {{url>https://docs.google.com/forms/d/e/1FAIpQLSdFL6jKLBe9YmbRlQI9MD04Swl8vPWZHGjxXlZSXulerfT2DA/viewform?usp=pp_url}} | ||
====== Regressão Linear Simples ====== | ====== Regressão Linear Simples ====== | ||
Linha 426: | Linha 428: | ||
\\ | \\ | ||
- | Vcs agora continuarão a pesquisa sobre o efeito das condições ambientais na produtividade primária de ecossistemas terrestres. Suponha que vcs estão interessados em entender o efeito da temperatura média anual (°C) sobre a produtividade primária líquida (MgC/ha/ano). Dado que a temperatura média anual dos ecossistemas terrestres está diretamente relacionada ao comprimento da estação de crescimento, a hipótese científica a ser testada é se a temperatura tem efeito positivo sobre a produtividade. Utilize o conjuntos de dados {{ :cursos:planeco:roteiro:produtividade_temp.txt |produtividade_temp.txt}}((Caso os dados abram em uma aba do navegador, clique com o botão direito do mouse e utilize o menu "Salvar link como..." ou algo parecido para salvar o arquivo em um diretório do seu computador.)), faça a regressão linear simples, interprete os resultados e avalie o atendimento das premissas do modelo. Preencha o seguinte [[https://docs.google.com/forms/d/e/1FAIpQLSdgCuAhTbKoidM5JBpJoQIvYYJQNLIvGPBIyb5hMRB-pw5htw/viewform?usp=pp_url| formulário]] para registrar suas respostas. | + | Vcs agora continuarão a pesquisa sobre o efeito das condições ambientais na produtividade primária de ecossistemas terrestres. Suponha que vcs estão interessados em entender o efeito da temperatura média anual (°C) sobre a produtividade primária líquida (MgC/ha/ano). Dado que a temperatura média anual dos ecossistemas terrestres está diretamente relacionada ao comprimento da estação de crescimento, a hipótese científica a ser testada é se a temperatura tem efeito positivo sobre a produtividade. Utilize o conjuntos de dados {{ :cursos:planeco:roteiro:produtividade_temp.txt |produtividade_temp.txt}}((Caso os dados abram em uma aba do navegador, clique com o botão direito do mouse e utilize o menu "Salvar link como..." ou algo parecido para salvar o arquivo em um diretório do seu computador.)), faça a regressão linear simples, interprete os resultados e avalie o atendimento das premissas do modelo. Preencha o seguinte [[https://docs.google.com/forms/d/e/1FAIpQLSdV6OpfCM1sAetfQxeap_uYDxC5xsCm4GjMGrH1wBcI1gEI3Q/viewform?usp=sf_link| formulário]] para registrar suas respostas. |