Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:07-class_base

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
Próxima revisão Ambos lados da revisão seguinte
cursos:planeco:roteiro:07-class_base [2022/03/25 10:02]
adalardo
cursos:planeco:roteiro:07-class_base [2024/02/26 17:41]
127.0.0.1 edição externa
Linha 3: Linha 3:
 ====== Testes Clássicos ====== ====== Testes Clássicos ======
  
-Os testes clássicos estatísticos estão inseridos no escopo da estatística frequentista ou inferência frequentista. Nessa abordagem a inferência ​é baseada na frequência ​ou proporção dos dados amostrados+Os testes clássicos estatísticos estão inseridos no escopo da estatística frequentista ou inferência frequentista. Nessa abordagem a probabilidade ​é considerada uma frequência e a inferencia está baseada na frequência ​com que eventos ocorrem nos dados coletados
  
 /* /*
Linha 22: Linha 22:
 ====== Anova ====== ====== Anova ======
  
- 
-Antes de iniciar o roteiro, assista a aula gravada no nosso canal do Youtube. 
  
 <WRAP center round box 80%> <WRAP center round box 80%>
 **//__Aula Gravada -  Anova: Partição da Variaçao__//​** **//__Aula Gravada -  Anova: Partição da Variaçao__//​**
-{{ youtube>​pQ5E6YXQR5I|}}+ 
 + 
 +Esssa video aula foi gravada durante a pandemia e permanece aqui como material de referência e consulta 
 + 
 +{{ youtube>​pQ5E6YXQR5I |}}
 </​WRAP>​ </​WRAP>​
  
  
  
-Na aula sobre [[cursos:​planeco:​roteiro:​02-hipot|teste de hipótese]] utilizamos técnicas de Monte Carlo para testar a hipótese de que duas médias são distintas, ou que uma é maior/menor que outra, tanto no exemplo do  [[cursos:​planeco:​roteiro:​02-hipot#​Tutorial Árvores do Mangue|]], quanto no exercício [[cursos:​planeco:​roteiro:​02-hipot#​Exercício| Altura dos alunos]]. Em ambos os casos estávamos comparando médias de dois grupos distintos, por exemplo, dois tipos de solos no mangue ou gênero dos alunos. O nosso procedimento foi análogo ao teste frequentista ​ **//t// de Student**, mas a forma de obter o //​**p-valor**//​ foi diferente. Nos procedimentos anteriores, simulamos o cenário nulo e comparamos o valor observado (diferença das médias) com a distribuição de probabilidades obtidas por meio dessa simulação. Na abordagem __clássica__ do teste frequentista **//t// de Student**, ​o valor observado ​ (diferença das médias) ​é comparado ​com uma distribuição ​estatística ​//​**t**// ​conhecida previamenteque foi desenvolvida pelo matemático William Gosset.+Na aula sobre [[cursos:​planeco:​roteiro:​02-hipot|teste de hipótese]] utilizamos técnicas de Monte Carlo para testar a hipótese de que duas médias são distintas, ou que uma é maior/menor que outra, tanto no exemplo do  [[cursos:​planeco:​roteiro:​02-hipot#​Tutorial Árvores do Mangue|]], quanto no exercício [[cursos:​planeco:​roteiro:​02-hipot#​Exercício| Altura dos alunos]]. Em ambos os casos estávamos comparando médias de dois grupos distintos, por exemplo, dois tipos de solos no mangue ou gênero dos alunos. O nosso procedimento foi análogo ao teste frequentista ​ **//t// de Student**, mas a forma de obter o //​**p-valor**//​ foi diferente. Nos procedimentos anteriores, simulamos o cenário nulo e comparamos o valor observado (diferença das médias) com a distribuição de probabilidades obtidas por meio dessa simulação. Na abordagem __clássica__ do teste frequentista **//t// de Student**, ​a estatística de interesse ​ //t// da amostra ​é comparada ​com distribuição ​probabilística ​//**t**// , desenvolvida pelo matemático ​britânico ​William Gosset.
 <WRAP center round important 70%> <WRAP center round important 70%>
  
Linha 67: Linha 69:
 A representação gráfica desses dados pode ser feita em um boxplot. A representação gráfica desses dados pode ser feita em um boxplot.
  
-{{ :​cursos:​planeco:​roteiro:​solosAnova.png?​400 ​ |}}+<WRAP center round box 60%> 
 +{{ :​cursos:​planeco:​roteiro:​boxplotAnova.png?400 |}} 
 + 
 +</​WRAP>​
  
 É possível notar que há uma grande variação na produtividade entre os solos e também muita variação dentro de um mesmo tipo de solo. Para ter alguma confiança para afirmar que o solo influencia a produtividade,​ podemos nos basear na variação dos dados e na partição em seus componentes,​ ou seja, dentro de cada grupo (ou intra grupo) e entre os grupos do tratamento (tipos de solos). Primeiro vamos definir o que é a variação total dos dados. É possível notar que há uma grande variação na produtividade entre os solos e também muita variação dentro de um mesmo tipo de solo. Para ter alguma confiança para afirmar que o solo influencia a produtividade,​ podemos nos basear na variação dos dados e na partição em seus componentes,​ ou seja, dentro de cada grupo (ou intra grupo) e entre os grupos do tratamento (tipos de solos). Primeiro vamos definir o que é a variação total dos dados.
Linha 181: Linha 186:
 <WRAP center round tip 70%> <WRAP center round tip 70%>
 **__Como calcular o p-valor a partir do F __** **__Como calcular o p-valor a partir do F __**
-  * A função ​//DIST.F// no Excel ou LibreOffice calcula o p-valor a partir da estatística **F** e  graus de liberdade; ​+  * A função ​''​DIST.F'' ​no Excel ou LibreOffice calcula o p-valor a partir da estatística **F** e  graus de liberdade; ​
   * usualmente a função recebe o valor de **F**, seguido dos graus de liberdade entre e intra grupos;   * usualmente a função recebe o valor de **F**, seguido dos graus de liberdade entre e intra grupos;
-  * o resultado da função ​//DIST.F// é a probabilidade cumulativa;​ +  * normalmente ​o resultado da função ​''​DIST.F'' ​é a probabilidade cumulativa, mas fique atento, pode ser a densidade probabilística,​ dependendo do padrão do Excel. Consulte a documentação do [[https://​support.microsoft.com/​pt-br/​office/​dist-f-fun%C3%A7%C3%A3o-dist-f-a887efdc-7c8e-46cb-a74a-f884cd29b25d|''​DIST.F''​ do Excel]] caso tenha dúvida
-  * o p-valor é igual a 1 menos essa probabilidade. ​  +  * no caso do valor retornado seja a probabilidade cumulativa, ​o p-valor é igual a 1 menos essa probabilidade ​((a densidade probabilística não permite o cálculo do p-valor, portanto, é preciso calcular a probabilidade cumulativa e subtrair de um para o cálculo do p-valor)).   
 </​WRAP>​ </​WRAP>​
  
Linha 190: Linha 195:
  
 <WRAP center round tip 70%> <WRAP center round tip 70%>
 +
 **__ ANOVA no Rcmdr __** **__ ANOVA no Rcmdr __**
   * importe os dados apenas com as colunas de dados brutos;   * importe os dados apenas com as colunas de dados brutos;
-  * o menu //​Estatísticas// ​está separado em tipos de estatísticas e qual o parâmetro associado ao teste de hipótese estatístico;​ +  * o menu ''​Statistics'' ​está separado em tipos de estatísticas e qual o parâmetro associado ao teste de hipótese estatístico;​ 
-  * o nosso teste é sobre médias, portanto no sub-menu ​//Médias//+  * o nosso teste é sobre médias, portanto no sub-menu ​''​Mean''​
-  * nele há a opção ​//ANOVA para um fator (one way)...//+  * nele há a opção ​''​Multi-way ANOVA''​...
   * o resultado aparecerá na janela //​Output//​. ​   * o resultado aparecerá na janela //​Output//​. ​
 +
 </​WRAP>​ </​WRAP>​
  
Linha 423: Linha 430:
 \\ \\
  
-Vcs agora continuarão a pesquisa sobre o efeito das condições ambientais na produtividade primária de ecossistemas terrestres. Suponha que vcs estão interessados em entender o efeito da temperatura média anual (°C) sobre a produtividade primária líquida (MgC/​ha/​ano). Dado que a temperatura média anual dos ecossistemas terrestres está diretamente relacionada ao comprimento da estação de crescimento,​ a hipótese científica a ser testada é se a temperatura tem efeito positivo sobre a produtividade. ​ Utilize o conjuntos de dados {{ :​cursos:​planeco:​roteiro:​produtividade_temp.txt |produtividade_temp.txt}}((Caso os dados abram em uma aba do navegador, clique com o botão direito do mouse e utilize o menu "​Salvar link como..."​ ou algo parecido para salvar o arquivo em um diretório do seu computador.)),​ faça a regressão linear simples, interprete os resultados e avalie o atendimento das premissas do modelo. Preencha o seguinte [[https://​docs.google.com/​forms/​d/​e/​1FAIpQLSdgCuAhTbKoidM5JBpJoQIvYYJQNLIvGPBIyb5hMRB-pw5htw/​viewform?​usp=pp_url| formulário]] para registrar suas respostas.+Vcs agora continuarão a pesquisa sobre o efeito das condições ambientais na produtividade primária de ecossistemas terrestres. Suponha que vcs estão interessados em entender o efeito da temperatura média anual (°C) sobre a produtividade primária líquida (MgC/​ha/​ano). Dado que a temperatura média anual dos ecossistemas terrestres está diretamente relacionada ao comprimento da estação de crescimento,​ a hipótese científica a ser testada é se a temperatura tem efeito positivo sobre a produtividade. ​ Utilize o conjuntos de dados {{ :​cursos:​planeco:​roteiro:​produtividade_temp.txt |produtividade_temp.txt}}((Caso os dados abram em uma aba do navegador, clique com o botão direito do mouse e utilize o menu "​Salvar link como..."​ ou algo parecido para salvar o arquivo em um diretório do seu computador.)),​ faça a regressão linear simples, interprete os resultados e avalie o atendimento das premissas do modelo. Preencha o seguinte [[https://​docs.google.com/​forms/​d/​e/​1FAIpQLSdV6OpfCM1sAetfQxeap_uYDxC5xsCm4GjMGrH1wBcI1gEI3Q/​viewform?​usp=sf_link| formulário]] para registrar suas respostas.
  
  
cursos/planeco/roteiro/07-class_base.txt · Última modificação: 2024/02/26 18:02 (edição externa)