Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:10-glm

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
cursos:planeco:roteiro:10-glm [2022/04/20 19:06]
adalardo [Contagem: um exemplo simples]
cursos:planeco:roteiro:10-glm [2024/04/03 17:32] (atual)
Linha 83: Linha 83:
       *  um nível médio de ''​pH''​ com ''​Biomass''​ de **15.5**       *  um nível médio de ''​pH''​ com ''​Biomass''​ de **15.5**
       *  um nível baixo de ''​pH''​ com ''​Biomass''​ de **7.1**       *  um nível baixo de ''​pH''​ com ''​Biomass''​ de **7.1**
- 
  
 /* /*
-Faça o diagnóstico do resíduos do modelo mínimo adequado.+  - Faça os gráficos diagnósticos dos resíduos do modelo mínimo adequado ​selecionado.
 */ */
- 
    
 ==== Modelo Linear Generalizado (GLM) ==== ==== Modelo Linear Generalizado (GLM) ====
Linha 142: Linha 140:
  
  
-O padrão do R é ordenar as variáveis categóricas por ordem alfabética. No exemplo seria desejável reordenar a variável categórica ​**//ph//** em uma categórica ordenada  ​**low>​medium>​high**Para reordenar utilize ​o menu **Data>​Manager variable in active data set> Reorder factor levels**. Caso não deseje sobrescrever ​a variável ​original, forneça um novo nome para variável reordenada.+O padrão do R é ordenar as variáveis categóricas por ordem alfabética. No exemplo seria desejável reordenar a variável categórica ​''​ph'' ​em uma categórica ordenada  ​''​low>​medium>​high''​ 
 + 
 +<WRAP center round box 90%> 
 +  * reordene a variável ''​ph''​ utilizando ​o menu ''​Data>​Manager variable in active data set> Reorder factor levels''​  
 +  ​crie a variável ​''​factor''​ com o nome ''​phF''​ na caixa ''​factor name''​ e selecion ​caixa ''​Faça fator ordenado'',​ em seguida clique em ''​OK'';​ 
 +  * reordene as variáveis inserindo ''​1'',​ ''​2''​ e ''​3''​ nas caixas dos níveis ''​low'',​ ''​medium'',​ ''​high''​
  
 </​WRAP>​ </​WRAP>​
  
-==== O que preciso entregar ​====+</​WRAP>​ 
 + 
 +==== Formulário de Perguntas ​====
  
  
Linha 152: Linha 157:
    
    
-  * Preencha ​as perguntas ​do quadro abaixo ou pelo [[https://​forms.gle/​Y3Cka1kHQ3to354E9|link do formulário]]+  * Responda ​as perguntas ​ [[https://​forms.gle/​25sHYMhmKM1WfT5K9|do formulário]] 
  
  
  
  
-{{url>​https://​forms.gle/​Y3Cka1kHQ3to354E9}} 
  
 </​WRAP>​ </​WRAP>​
 +
 ===== Contagem: o que faz um aluno faltar às aulas ===== ===== Contagem: o que faz um aluno faltar às aulas =====
  
Linha 302: Linha 308:
  <​WRAP center round box 80%>  <​WRAP center round box 80%>
  
-  * monte o modelo cheio utilizando a família ''​quasipoisson''​ e  +  * monte o modelo cheio utilizando a família ''​quasipoisson'';​ 
-  * siga em frente simplificando o modelo para o mínimo adequado  +  * verifique se o parâmetro de dispersão compensa a razão entre ''​Residual deviance''​ e os respectivos ''​degrees of freedom''; ​ 
-  * interprete o modelo selecionado+  * siga em frente simplificando o modelo para o mínimo adequado
 +  * o que está representado no intercepto do modelo selecionado e qual a predição de dias de aulas perdidas para esse aluno? ​  
 +  * faça a predição do modelo para os seguintes alunos: 
 +      * menino aborígene no ano ''​F2''​ 
 +      * menino não aborígene no ano ''​F2''​ 
 +      * menina aborígene no ano ''​F3''​ 
 +      * menina não aborígene no ano ''​F3''​ 
 + 
 +  * interprete o modelo selecionado.
  
 </​WRAP>​ </​WRAP>​
Linha 330: Linha 344:
 */ */
  
-==== O que preciso entregar ​====+==== Formulário de Perguntas ​====
  
  
Linha 336: Linha 350:
    
    
-  * Preencha ​as perguntas ​do quadro abaixo ou pelo [[https://​forms.gle/​WdAzcHBpF25NeMkd9|link do formulário]]+  * Responda ​as perguntas [[https://​forms.gle/​WdAzcHBpF25NeMkd9|do formulário]]
  
  
  
  
-{{url>​https://​forms.gle/​WdAzcHBpF25NeMkd9}} 
  
 </​WRAP>​ </​WRAP>​
Linha 389: Linha 402:
 Note como a __**chance**__ de ocorrência de um evento é a probabilidade de ocorrência deste evento dividida pela probabilidade da não ocorrência do mesmo evento. ​ Note como a __**chance**__ de ocorrência de um evento é a probabilidade de ocorrência deste evento dividida pela probabilidade da não ocorrência do mesmo evento. ​
  
-A __**chance**__ ​ é muito usada em apostas, quando, por exemplo, dizemos que a chance de um time vencer é de ''​4:​1''​ ((ou que está pagando 4:1)), ou seja, a probabilidade de vencer é ''​4x''​ maior do que a de perder. O conceito de chance é muito importante nos modelos binomiais e devemos evitar confundi-lo com probabilidade. Chance e probabilidade são escalas distintas para medir a ocorrência de sucessos. ​+A __**chance**__ ​ é muito usada em apostas, quando, por exemplo, dizemos que a chance de um time vencer é de ''​4:​1''​ ((ou que está pagando 4 a cada apostado)), ou seja, a probabilidade de vencer é ''​4x''​ maior do que a de perder. O conceito de chance é muito importante nos modelos binomiais e devemos evitar confundi-lo com probabilidade. Chance e probabilidade são escalas distintas para medir a ocorrência de sucessos. ​
  
 </​WRAP>​ </​WRAP>​
Linha 407: Linha 420:
 $$\alpha + \sum\beta_{x_i}$$ $$\alpha + \sum\beta_{x_i}$$
  
-É a estrutura determinística do modelo modelo linear, agora não mais relacionado diretamente à escala da variável resposta.  ​+É a estrutura determinística do modelo modelo linear, agora não mais relacionado diretamente à escala da variável resposta ​''​y''​ e sim a um preditor linear $\eta$.  ​
  
 A função de ligação é o que relaciona o preditor linear com a esperança do modelo: A função de ligação é o que relaciona o preditor linear com a esperança do modelo:
Linha 437: Linha 450:
 então, exponenciar os coeficientes do modelo binomial com preditora categórica transforma os coeficientes em razão de chance comparado com o nível basal ((lembre-se que as categóricas são transformadas em variáveis indicadoras ou dummy e um dos níveis é transportado para o intercepto do modelo, sendo esse o nível basal ou controle)). então, exponenciar os coeficientes do modelo binomial com preditora categórica transforma os coeficientes em razão de chance comparado com o nível basal ((lembre-se que as categóricas são transformadas em variáveis indicadoras ou dummy e um dos níveis é transportado para o intercepto do modelo, sendo esse o nível basal ou controle)).
  
-A //**razão de chance**// ​ mede o quanto uma chance é proporcionalmente diferente de outra, geralmente comparando com um nível controle. Ou seja, qual a proporção de mudança na chance do tratamento em relação a chance do controle. Pensando em nosso experimento de germinação tendo o ''​solo arenoso''​ como nível de referência,​ a razão de chance do ''​solo ​arenoso''​ seria o quanto a chance de germinar no ''​arenoso''​ proporcionalmente maior que a chance de germinar no solo ''​arenoso''​.  ​+A //**razão de chance**// ​ mede o quanto uma chance é proporcionalmente diferente de outra, geralmente comparando com um nível controle. Ou seja, qual a proporção de mudança na chance do tratamento em relação a chance do controle. Pensando em nosso experimento de germinação tendo o ''​solo arenoso''​ como nível de referência,​ a razão de chance do ''​solo ​argiloso''​ seria o quanto a chance de germinar no ''​argiloso'' ​é proporcionalmente maior/​menor ​que a chance de germinar no solo ''​arenoso''​.  ​
  
 Parece complicado, mas é apenas por falta de intimidade com essas escalas, a razão de chance é uma medida muito popular em outras áreas da ciência, como medicina. Importante lembrar que a ''​razão de chance''​ mede o efeito proporcional em relação ao nível de referência. ​ Parece complicado, mas é apenas por falta de intimidade com essas escalas, a razão de chance é uma medida muito popular em outras áreas da ciência, como medicina. Importante lembrar que a ''​razão de chance''​ mede o efeito proporcional em relação ao nível de referência. ​
Linha 480: Linha 493:
 ** Importante: ** ** Importante: **
   * lembre-se que a ''​family''​ nesse caso é ''​binomial''​   * lembre-se que a ''​family''​ nesse caso é ''​binomial''​
-  * os modelos com variáveis resposta binárias não tem problema com sobre-dispersão!!!+  * os modelos com variáveis resposta binárias ​bernoli (apenas uma tentativa) ​não tem problema com sobre-dispersão!!!
  
 </​WRAP>​ </​WRAP>​
Linha 507: Linha 520:
 </​WRAP>​ </​WRAP>​
  
-==== O que preciso entregar ====+==== O que preciso entregar====
  
  
Linha 513: Linha 526:
    
    
-  * Preencha ​as perguntas do quadro abaixo ou pelo [[https://​forms.gle/​dUqZad77fU8Hrqrm8|link do formulário]] +  * Preencha ​[[https://​forms.gle/​JfAHqWKjeb1tAycPA|formulário]]
  
  
  
-{{url>​https://​forms.gle/​dUqZad77fU8Hrqrm8}} 
  
 </​WRAP>​ </​WRAP>​
Linha 633: Linha 644:
 $$\hat{y} = \frac{e^{\hat{\eta}}}{1+e^{\hat{\eta}}} $$  $$\hat{y} = \frac{e^{\hat{\eta}}}{1+e^{\hat{\eta}}} $$ 
  
-<WRAP center round todo 80%>+<WRAP center round todo 95%>
  
-  * calcule o predito pelo modelo ​e os coeficientes ​na escala ​original +  * calcule o predito pelo modelo na escala ​de probabilidade de floração ​para os valores ​das variáveis preditoras ''​dose''​ e ''​variety'' ​dos dados originais ;
-  * interprete o efeito da concentração na floração das variedades a partir ​dos coeficientes do modelo selecionado+
  
-</​WRAP>​ +<WRAP center round tip 90%>
- +
- +
-<WRAP center round tip 80%>+
  
 **__Transformar os coeficientes e valores preditos pelo GLM:__** **__Transformar os coeficientes e valores preditos pelo GLM:__**
  
-Para transformar o valor predito pelo modelo (''​log(odds-ratio)''​) na escala de medida (proporção ou probabilidade) é preciso transformar os preditos pelo modelo. Para gerar as predições do modelo usamos a função ''​predict'',​ como no código abaixo. O predito pelo modeloestá na escala do preditor linear, portanto é necessário transformar essa medida com a função ​ inversa da logit, como no código abaixo. <wrap hi>​Lembre-se de mudar, no código, o "​nomedomodelo"</​wrap>​ pelo nome que usou quando construiu o glm.+Para transformar o valor predito pelo modelo (''​log(odds-ratio)''​) na escala de medida (proporção ou probabilidade) é preciso transformar os preditos pelo modelo. Para gerar as predições do modelo usamos a função ''​predict'',​ como no código abaixo. O predito pelo modelo está na escala do preditor linear, portanto é necessário transformar essa medida com a função ​ inversa da logit, como no código abaixo. <wrap hi>​Lembre-se de mudar, no código, o "​nomedomodelo"</​wrap>​ pelo nome que usou quando construiu o glm.
  
 <​code>​ <​code>​
  
-preditoLinear <- predict("nomedomodelo")+preditoLinear <- predict(nomedomodelo)
 preditoProp <- exp(preditoLinear)/​(1+ exp(preditoLinear)) preditoProp <- exp(preditoLinear)/​(1+ exp(preditoLinear))
  
Linha 658: Linha 665:
 <​code>​ <​code>​
  
-predito <- predict("nomedomodelo", type = "​response"​)+predito <- predict(nomedomodelo,​ type = "​response"​)
 predito predito
  
Linha 665: Linha 672:
  
 O **Rcmdr** não poderia ficar sem essa funcionalidade para interpretar os valores do predito pelo modelo na escala de observação:​ utilize o menu **Models>​ add observation statistic to data...>​** e selecione apenas o **Fitted values**. O Rcmdr adiciona uma coluna nos dados chamada ''​fitted."​nome_do_modelo"'',​ com os previstos na escala de observação,​ nesse caso probabilidade. O **Rcmdr** não poderia ficar sem essa funcionalidade para interpretar os valores do predito pelo modelo na escala de observação:​ utilize o menu **Models>​ add observation statistic to data...>​** e selecione apenas o **Fitted values**. O Rcmdr adiciona uma coluna nos dados chamada ''​fitted."​nome_do_modelo"'',​ com os previstos na escala de observação,​ nesse caso probabilidade.
 +</​WRAP>​
 +
 +  * calcule o predito pelo modelo para todas as variedades com doses de hormônio de: 5.5, 12, 25;
 +  * interprete o efeito da concentração na floração das variedades a partir dos coeficientes do modelo selecionado
 +
 +
  
  
Linha 739: Linha 752:
    
    
-  * Preencha ​as perguntas do quadro abaixo ou pelo [[https://​forms.gle/​GJmq6V712YZkGZ27A|link do formulário]] +  * Responda ​as perguntas do [[https://​forms.gle/​1SxSUrNNcipTJgWD8|formulário]]
- +
  
  
-{{url>​https://​forms.gle/​GJmq6V712YZkGZ27A}} 
  
 </​WRAP>​ </​WRAP>​
cursos/planeco/roteiro/10-glm.1650492418.txt.gz · Última modificação: 2022/04/20 19:06 por adalardo