Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:10-glm

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
Próxima revisão Ambos lados da revisão seguinte
cursos:planeco:roteiro:10-glm [2024/03/26 17:18]
127.0.0.1 edição externa
cursos:planeco:roteiro:10-glm [2024/04/03 17:19]
127.0.0.1 edição externa
Linha 165: Linha 165:
  
 </​WRAP>​ </​WRAP>​
 +
 ===== Contagem: o que faz um aluno faltar às aulas ===== ===== Contagem: o que faz um aluno faltar às aulas =====
  
Linha 310: Linha 311:
   * verifique se o parâmetro de dispersão compensa a razão entre ''​Residual deviance''​ e os respectivos ''​degrees of freedom''; ​   * verifique se o parâmetro de dispersão compensa a razão entre ''​Residual deviance''​ e os respectivos ''​degrees of freedom''; ​
   * siga em frente simplificando o modelo para o mínimo adequado;   * siga em frente simplificando o modelo para o mínimo adequado;
 +  * o que está representado no intercepto do modelo selecionado e qual a predição de dias de aulas perdidas para esse aluno?  ​
   * faça a predição do modelo para os seguintes alunos:   * faça a predição do modelo para os seguintes alunos:
       * menino aborígene no ano ''​F2''​       * menino aborígene no ano ''​F2''​
       * menino não aborígene no ano ''​F2''​       * menino não aborígene no ano ''​F2''​
       * menina aborígene no ano ''​F3''​       * menina aborígene no ano ''​F3''​
-      * menina não aborígene no ano ''​F3' ​ +      * menina não aborígene no ano ''​F3'​
   * interprete o modelo selecionado.   * interprete o modelo selecionado.
  
Linha 399: Linha 402:
 Note como a __**chance**__ de ocorrência de um evento é a probabilidade de ocorrência deste evento dividida pela probabilidade da não ocorrência do mesmo evento. ​ Note como a __**chance**__ de ocorrência de um evento é a probabilidade de ocorrência deste evento dividida pela probabilidade da não ocorrência do mesmo evento. ​
  
-A __**chance**__ ​ é muito usada em apostas, quando, por exemplo, dizemos que a chance de um time vencer é de ''​4:​1''​ ((ou que está pagando 4:1)), ou seja, a probabilidade de vencer é ''​4x''​ maior do que a de perder. O conceito de chance é muito importante nos modelos binomiais e devemos evitar confundi-lo com probabilidade. Chance e probabilidade são escalas distintas para medir a ocorrência de sucessos. ​+A __**chance**__ ​ é muito usada em apostas, quando, por exemplo, dizemos que a chance de um time vencer é de ''​4:​1''​ ((ou que está pagando 4 a cada apostado)), ou seja, a probabilidade de vencer é ''​4x''​ maior do que a de perder. O conceito de chance é muito importante nos modelos binomiais e devemos evitar confundi-lo com probabilidade. Chance e probabilidade são escalas distintas para medir a ocorrência de sucessos. ​
  
 </​WRAP>​ </​WRAP>​
Linha 417: Linha 420:
 $$\alpha + \sum\beta_{x_i}$$ $$\alpha + \sum\beta_{x_i}$$
  
-É a estrutura determinística do modelo modelo linear, agora não mais relacionado diretamente à escala da variável resposta.  ​+É a estrutura determinística do modelo modelo linear, agora não mais relacionado diretamente à escala da variável resposta ​''​y''​ e sim a um preditor linear $\eta$.  ​
  
 A função de ligação é o que relaciona o preditor linear com a esperança do modelo: A função de ligação é o que relaciona o preditor linear com a esperança do modelo:
Linha 447: Linha 450:
 então, exponenciar os coeficientes do modelo binomial com preditora categórica transforma os coeficientes em razão de chance comparado com o nível basal ((lembre-se que as categóricas são transformadas em variáveis indicadoras ou dummy e um dos níveis é transportado para o intercepto do modelo, sendo esse o nível basal ou controle)). então, exponenciar os coeficientes do modelo binomial com preditora categórica transforma os coeficientes em razão de chance comparado com o nível basal ((lembre-se que as categóricas são transformadas em variáveis indicadoras ou dummy e um dos níveis é transportado para o intercepto do modelo, sendo esse o nível basal ou controle)).
  
-A //**razão de chance**// ​ mede o quanto uma chance é proporcionalmente diferente de outra, geralmente comparando com um nível controle. Ou seja, qual a proporção de mudança na chance do tratamento em relação a chance do controle. Pensando em nosso experimento de germinação tendo o ''​solo arenoso''​ como nível de referência,​ a razão de chance do ''​solo ​arenoso''​ seria o quanto a chance de germinar no ''​arenoso''​ proporcionalmente maior que a chance de germinar no solo ''​arenoso''​.  ​+A //**razão de chance**// ​ mede o quanto uma chance é proporcionalmente diferente de outra, geralmente comparando com um nível controle. Ou seja, qual a proporção de mudança na chance do tratamento em relação a chance do controle. Pensando em nosso experimento de germinação tendo o ''​solo arenoso''​ como nível de referência,​ a razão de chance do ''​solo ​argiloso''​ seria o quanto a chance de germinar no ''​argiloso'' ​é proporcionalmente maior/​menor ​que a chance de germinar no solo ''​arenoso''​.  ​
  
 Parece complicado, mas é apenas por falta de intimidade com essas escalas, a razão de chance é uma medida muito popular em outras áreas da ciência, como medicina. Importante lembrar que a ''​razão de chance''​ mede o efeito proporcional em relação ao nível de referência. ​ Parece complicado, mas é apenas por falta de intimidade com essas escalas, a razão de chance é uma medida muito popular em outras áreas da ciência, como medicina. Importante lembrar que a ''​razão de chance''​ mede o efeito proporcional em relação ao nível de referência. ​
Linha 490: Linha 493:
 ** Importante: ** ** Importante: **
   * lembre-se que a ''​family''​ nesse caso é ''​binomial''​   * lembre-se que a ''​family''​ nesse caso é ''​binomial''​
-  * os modelos com variáveis resposta binárias não tem problema com sobre-dispersão!!!+  * os modelos com variáveis resposta binárias ​bernoli (apenas uma tentativa) ​não tem problema com sobre-dispersão!!!
  
 </​WRAP>​ </​WRAP>​
Linha 517: Linha 520:
 </​WRAP>​ </​WRAP>​
  
-==== O que preciso entregar ====+==== O que preciso entregar====
  
  
Linha 523: Linha 526:
    
    
-  * Preencha ​as perguntas do quadro abaixo ou pelo [[https://​forms.gle/​dUqZad77fU8Hrqrm8|link do formulário]] +  * Preencha ​[[https://​forms.gle/​JfAHqWKjeb1tAycPA|formulário]]
  
  
  
-{{url>​https://​forms.gle/​dUqZad77fU8Hrqrm8}} 
  
 </​WRAP>​ </​WRAP>​
Linha 643: Linha 644:
 $$\hat{y} = \frac{e^{\hat{\eta}}}{1+e^{\hat{\eta}}} $$  $$\hat{y} = \frac{e^{\hat{\eta}}}{1+e^{\hat{\eta}}} $$ 
  
-<WRAP center round todo 80%>+<WRAP center round todo 95%>
  
-  * calcule o predito pelo modelo ​para as variáveis preditoras e os coeficientes ​na escala ​original; +  * calcule o predito pelo modelo na escala de probabilidade ​de floração ​para os valores ​das variáveis preditoras ''​dose''​ e ''​variety'' ​dos dados originais ;
-  * calcule o predito pelo modelo para todas as variedades com doses de hormônio ​de: 5.5, 12, 25; +
-  * interprete o efeito da concentração na floração das variedades a partir ​dos coeficientes do modelo selecionado+
  
-</​WRAP>​ +<WRAP center round tip 90%>
- +
- +
-<WRAP center round tip 80%>+
  
 **__Transformar os coeficientes e valores preditos pelo GLM:__** **__Transformar os coeficientes e valores preditos pelo GLM:__**
  
-Para transformar o valor predito pelo modelo (''​log(odds-ratio)''​) na escala de medida (proporção ou probabilidade) é preciso transformar os preditos pelo modelo. Para gerar as predições do modelo usamos a função ''​predict'',​ como no código abaixo. O predito pelo modeloestá na escala do preditor linear, portanto é necessário transformar essa medida com a função ​ inversa da logit, como no código abaixo. <wrap hi>​Lembre-se de mudar, no código, o "​nomedomodelo"</​wrap>​ pelo nome que usou quando construiu o glm.+Para transformar o valor predito pelo modelo (''​log(odds-ratio)''​) na escala de medida (proporção ou probabilidade) é preciso transformar os preditos pelo modelo. Para gerar as predições do modelo usamos a função ''​predict'',​ como no código abaixo. O predito pelo modelo está na escala do preditor linear, portanto é necessário transformar essa medida com a função ​ inversa da logit, como no código abaixo. <wrap hi>​Lembre-se de mudar, no código, o "​nomedomodelo"</​wrap>​ pelo nome que usou quando construiu o glm.
  
 <​code>​ <​code>​
Linha 676: Linha 672:
  
 O **Rcmdr** não poderia ficar sem essa funcionalidade para interpretar os valores do predito pelo modelo na escala de observação:​ utilize o menu **Models>​ add observation statistic to data...>​** e selecione apenas o **Fitted values**. O Rcmdr adiciona uma coluna nos dados chamada ''​fitted."​nome_do_modelo"'',​ com os previstos na escala de observação,​ nesse caso probabilidade. O **Rcmdr** não poderia ficar sem essa funcionalidade para interpretar os valores do predito pelo modelo na escala de observação:​ utilize o menu **Models>​ add observation statistic to data...>​** e selecione apenas o **Fitted values**. O Rcmdr adiciona uma coluna nos dados chamada ''​fitted."​nome_do_modelo"'',​ com os previstos na escala de observação,​ nesse caso probabilidade.
 +
 +  * calcule o predito pelo modelo para todas as variedades com doses de hormônio de: 5.5, 12, 25;
 +  * interprete o efeito da concentração na floração das variedades a partir dos coeficientes do modelo selecionado
 +
 +</​WRAP>​
 +
  
  
Linha 750: Linha 752:
    
    
-  * Preencha ​as perguntas do quadro abaixo ou pelo [[https://​forms.gle/​GJmq6V712YZkGZ27A|link do formulário]] +  * Responda ​as perguntas do [[https://​forms.gle/​1SxSUrNNcipTJgWD8|formulário]]
- +
  
  
-{{url>​https://​forms.gle/​GJmq6V712YZkGZ27A}} 
  
 </​WRAP>​ </​WRAP>​
cursos/planeco/roteiro/10-glm.txt · Última modificação: 2024/04/03 17:32 (edição externa)