Ferramentas do usuário

Ferramentas do site


cursos:planeco:roteiro:10-glm

Diferenças

Aqui você vê as diferenças entre duas revisões dessa página.

Link para esta página de comparações

Ambos lados da revisão anterior Revisão anterior
Próxima revisão
Revisão anterior
Próxima revisão Ambos lados da revisão seguinte
cursos:planeco:roteiro:10-glm [2022/04/20 10:53]
adalardo [O que preciso entregar]
cursos:planeco:roteiro:10-glm [2024/04/03 17:19]
127.0.0.1 edição externa
Linha 82: Linha 82:
       *  um nível alto de ''​pH''​ com ''​Biomass''​ de **3.2**       *  um nível alto de ''​pH''​ com ''​Biomass''​ de **3.2**
       *  um nível médio de ''​pH''​ com ''​Biomass''​ de **15.5**       *  um nível médio de ''​pH''​ com ''​Biomass''​ de **15.5**
-      *  um nível baixo de ''​pH''​ com ''​Biomass''​ de **7.2** +      *  um nível baixo de ''​pH''​ com ''​Biomass''​ de **7.1**
  
 /* /*
-Faça o diagnóstico do resíduos do modelo mínimo adequado.+  - Faça os gráficos diagnósticos dos resíduos do modelo mínimo adequado ​selecionado.
 */ */
- 
    
 ==== Modelo Linear Generalizado (GLM) ==== ==== Modelo Linear Generalizado (GLM) ====
Linha 142: Linha 140:
  
  
-O padrão do R é ordenar as variáveis categóricas por ordem alfabética. No exemplo seria desejável reordenar a variável categórica ​**//ph//** em uma categórica ordenada  ​**low>​medium>​high**Para reordenar utilize ​o menu **Data>​Manager variable in active data set> Reorder factor levels**. Caso não deseje sobrescrever ​a variável ​original, forneça um novo nome para variável reordenada.+O padrão do R é ordenar as variáveis categóricas por ordem alfabética. No exemplo seria desejável reordenar a variável categórica ​''​ph'' ​em uma categórica ordenada  ​''​low>​medium>​high''​ 
 + 
 +<WRAP center round box 90%> 
 +  * reordene a variável ''​ph''​ utilizando ​o menu ''​Data>​Manager variable in active data set> Reorder factor levels''​  
 +  ​crie a variável ​''​factor''​ com o nome ''​phF''​ na caixa ''​factor name''​ e selecion ​caixa ''​Faça fator ordenado'',​ em seguida clique em ''​OK'';​ 
 +  * reordene as variáveis inserindo ''​1'',​ ''​2''​ e ''​3''​ nas caixas dos níveis ''​low'',​ ''​medium'',​ ''​high''​
  
 </​WRAP>​ </​WRAP>​
  
-==== O que preciso entregar ​====+</​WRAP>​ 
 + 
 +==== Formulário de Perguntas ​====
  
  
Linha 152: Linha 157:
    
    
-  * Preencha ​as perguntas ​do quadro abaixo ou pelo [[https://​forms.gle/​Y3Cka1kHQ3to354E9|link do formulário]]+  * Responda ​as perguntas ​ [[https://​forms.gle/​25sHYMhmKM1WfT5K9|do formulário]] 
  
  
  
  
-{{url>​https://​forms.gle/​Y3Cka1kHQ3to354E9}} 
  
 </​WRAP>​ </​WRAP>​
 +
 ===== Contagem: o que faz um aluno faltar às aulas ===== ===== Contagem: o que faz um aluno faltar às aulas =====
  
Linha 302: Linha 308:
  <​WRAP center round box 80%>  <​WRAP center round box 80%>
  
-  * monte o modelo cheio utilizando a família ''​quasipoisson''​ e  +  * monte o modelo cheio utilizando a família ''​quasipoisson'';​ 
-  * siga em frente simplificando o modelo para o mínimo adequado  +  * verifique se o parâmetro de dispersão compensa a razão entre ''​Residual deviance''​ e os respectivos ''​degrees of freedom''; ​ 
-  * interprete o modelo selecionado+  * siga em frente simplificando o modelo para o mínimo adequado
 +  * o que está representado no intercepto do modelo selecionado e qual a predição de dias de aulas perdidas para esse aluno? ​  
 +  * faça a predição do modelo para os seguintes alunos: 
 +      * menino aborígene no ano ''​F2''​ 
 +      * menino não aborígene no ano ''​F2''​ 
 +      * menina aborígene no ano ''​F3''​ 
 +      * menina não aborígene no ano ''​F3''​ 
 + 
 +  * interprete o modelo selecionado.
  
 </​WRAP>​ </​WRAP>​
Linha 330: Linha 344:
 */ */
  
-==== O que preciso entregar ​====+==== Formulário de Perguntas ​====
  
  
Linha 336: Linha 350:
    
    
-  * Preencha ​as perguntas ​do quadro abaixo ou pelo [[https://​forms.gle/​WdAzcHBpF25NeMkd9|link do formulário]]+  * Responda ​as perguntas [[https://​forms.gle/​WdAzcHBpF25NeMkd9|do formulário]]
  
  
  
  
-{{url>​https://​forms.gle/​WdAzcHBpF25NeMkd9}} 
  
 </​WRAP>​ </​WRAP>​
Linha 389: Linha 402:
 Note como a __**chance**__ de ocorrência de um evento é a probabilidade de ocorrência deste evento dividida pela probabilidade da não ocorrência do mesmo evento. ​ Note como a __**chance**__ de ocorrência de um evento é a probabilidade de ocorrência deste evento dividida pela probabilidade da não ocorrência do mesmo evento. ​
  
-A __**chance**__ ​ é muito usada em apostas, quando, por exemplo, dizemos que a chance de um time vencer é de ''​4:​1''​ ((ou que está pagando 4:1)), ou seja, a probabilidade de vencer é ''​4x''​ maior do que a de perder. O conceito de chance é muito importante nos modelos binomiais e devemos evitar confundi-lo com probabilidade. Chance e probabilidade são escalas distintas para medir a ocorrência de sucessos. ​+A __**chance**__ ​ é muito usada em apostas, quando, por exemplo, dizemos que a chance de um time vencer é de ''​4:​1''​ ((ou que está pagando 4 a cada apostado)), ou seja, a probabilidade de vencer é ''​4x''​ maior do que a de perder. O conceito de chance é muito importante nos modelos binomiais e devemos evitar confundi-lo com probabilidade. Chance e probabilidade são escalas distintas para medir a ocorrência de sucessos. ​
  
 </​WRAP>​ </​WRAP>​
Linha 407: Linha 420:
 $$\alpha + \sum\beta_{x_i}$$ $$\alpha + \sum\beta_{x_i}$$
  
-É a estrutura determinística do modelo modelo linear, agora não mais relacionado diretamente à escala da variável resposta.  ​+É a estrutura determinística do modelo modelo linear, agora não mais relacionado diretamente à escala da variável resposta ​''​y''​ e sim a um preditor linear $\eta$.  ​
  
 A função de ligação é o que relaciona o preditor linear com a esperança do modelo: A função de ligação é o que relaciona o preditor linear com a esperança do modelo:
Linha 437: Linha 450:
 então, exponenciar os coeficientes do modelo binomial com preditora categórica transforma os coeficientes em razão de chance comparado com o nível basal ((lembre-se que as categóricas são transformadas em variáveis indicadoras ou dummy e um dos níveis é transportado para o intercepto do modelo, sendo esse o nível basal ou controle)). então, exponenciar os coeficientes do modelo binomial com preditora categórica transforma os coeficientes em razão de chance comparado com o nível basal ((lembre-se que as categóricas são transformadas em variáveis indicadoras ou dummy e um dos níveis é transportado para o intercepto do modelo, sendo esse o nível basal ou controle)).
  
-A //**razão de chance**// ​ mede o quanto uma chance é proporcionalmente diferente de outra, geralmente comparando com um nível controle. Ou seja, qual a proporção de mudança na chance do tratamento em relação a chance do controle. Pensando em nosso experimento de germinação tendo o ''​solo arenoso''​ como nível de referência,​ a razão de chance do ''​solo ​arenoso''​ seria o quanto a chance de germinar no ''​arenoso''​ proporcionalmente maior que a chance de germinar no solo ''​arenoso''​.  ​+A //**razão de chance**// ​ mede o quanto uma chance é proporcionalmente diferente de outra, geralmente comparando com um nível controle. Ou seja, qual a proporção de mudança na chance do tratamento em relação a chance do controle. Pensando em nosso experimento de germinação tendo o ''​solo arenoso''​ como nível de referência,​ a razão de chance do ''​solo ​argiloso''​ seria o quanto a chance de germinar no ''​argiloso'' ​é proporcionalmente maior/​menor ​que a chance de germinar no solo ''​arenoso''​.  ​
  
 Parece complicado, mas é apenas por falta de intimidade com essas escalas, a razão de chance é uma medida muito popular em outras áreas da ciência, como medicina. Importante lembrar que a ''​razão de chance''​ mede o efeito proporcional em relação ao nível de referência. ​ Parece complicado, mas é apenas por falta de intimidade com essas escalas, a razão de chance é uma medida muito popular em outras áreas da ciência, como medicina. Importante lembrar que a ''​razão de chance''​ mede o efeito proporcional em relação ao nível de referência. ​
Linha 480: Linha 493:
 ** Importante: ** ** Importante: **
   * lembre-se que a ''​family''​ nesse caso é ''​binomial''​   * lembre-se que a ''​family''​ nesse caso é ''​binomial''​
-  * os modelos com variáveis resposta binárias não tem problema com sobre-dispersão!!!+  * os modelos com variáveis resposta binárias ​bernoli (apenas uma tentativa) ​não tem problema com sobre-dispersão!!!
  
 </​WRAP>​ </​WRAP>​
Linha 507: Linha 520:
 </​WRAP>​ </​WRAP>​
  
-==== O que preciso entregar ====+==== O que preciso entregar====
  
  
Linha 513: Linha 526:
    
    
-  * Preencha ​as perguntas do quadro abaixo ou pelo [[https://​forms.gle/​dUqZad77fU8Hrqrm8|link do formulário]] +  * Preencha ​[[https://​forms.gle/​JfAHqWKjeb1tAycPA|formulário]]
  
  
  
-{{url>​https://​forms.gle/​dUqZad77fU8Hrqrm8}} 
  
 </​WRAP>​ </​WRAP>​
Linha 633: Linha 644:
 $$\hat{y} = \frac{e^{\hat{\eta}}}{1+e^{\hat{\eta}}} $$  $$\hat{y} = \frac{e^{\hat{\eta}}}{1+e^{\hat{\eta}}} $$ 
  
-<WRAP center round todo 80%>+<WRAP center round todo 95%>
  
-  * calcule o predito pelo modelo ​e os coeficientes ​na escala ​original +  * calcule o predito pelo modelo na escala ​de probabilidade de floração ​para os valores ​das variáveis preditoras ''​dose''​ e ''​variety'' ​dos dados originais ;
-  * interprete o efeito da concentração na floração das variedades a partir ​dos coeficientes do modelo selecionado+
  
-</​WRAP>​ +<WRAP center round tip 90%>
- +
- +
-<WRAP center round tip 80%>+
  
 **__Transformar os coeficientes e valores preditos pelo GLM:__** **__Transformar os coeficientes e valores preditos pelo GLM:__**
  
-Para transformar o valor predito pelo modelo (''​log(odds-ratio)''​) na escala de medida (proporção ou probabilidade) é preciso transformar os preditos pelo modelo. Para gerar as predições do modelo usamos a função ''​predict'',​ como no código abaixo. O predito pelo modeloestá na escala do preditor linear, portanto é necessário transformar essa medida com a função ​ inversa da logit, como no código abaixo. <wrap hi>​Lembre-se de mudar, no código, o "​nomedomodelo"</​wrap>​ pelo nome que usou quando construiu o glm.+Para transformar o valor predito pelo modelo (''​log(odds-ratio)''​) na escala de medida (proporção ou probabilidade) é preciso transformar os preditos pelo modelo. Para gerar as predições do modelo usamos a função ''​predict'',​ como no código abaixo. O predito pelo modelo está na escala do preditor linear, portanto é necessário transformar essa medida com a função ​ inversa da logit, como no código abaixo. <wrap hi>​Lembre-se de mudar, no código, o "​nomedomodelo"</​wrap>​ pelo nome que usou quando construiu o glm.
  
 <​code>​ <​code>​
Linha 665: Linha 672:
  
 O **Rcmdr** não poderia ficar sem essa funcionalidade para interpretar os valores do predito pelo modelo na escala de observação:​ utilize o menu **Models>​ add observation statistic to data...>​** e selecione apenas o **Fitted values**. O Rcmdr adiciona uma coluna nos dados chamada ''​fitted."​nome_do_modelo"'',​ com os previstos na escala de observação,​ nesse caso probabilidade. O **Rcmdr** não poderia ficar sem essa funcionalidade para interpretar os valores do predito pelo modelo na escala de observação:​ utilize o menu **Models>​ add observation statistic to data...>​** e selecione apenas o **Fitted values**. O Rcmdr adiciona uma coluna nos dados chamada ''​fitted."​nome_do_modelo"'',​ com os previstos na escala de observação,​ nesse caso probabilidade.
 +
 +  * calcule o predito pelo modelo para todas as variedades com doses de hormônio de: 5.5, 12, 25;
 +  * interprete o efeito da concentração na floração das variedades a partir dos coeficientes do modelo selecionado
 +
 +</​WRAP>​
 +
  
  
Linha 739: Linha 752:
    
    
-  * Preencha ​as perguntas do quadro abaixo ou pelo [[https://​forms.gle/​GJmq6V712YZkGZ27A|link do formulário]] +  * Responda ​as perguntas do [[https://​forms.gle/​1SxSUrNNcipTJgWD8|formulário]]
- +
  
  
-{{url>​https://​forms.gle/​GJmq6V712YZkGZ27A}} 
  
 </​WRAP>​ </​WRAP>​
cursos/planeco/roteiro/10-glm.txt · Última modificação: 2024/04/03 17:32 (edição externa)