Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
cursos:planeco:roteiro:09-lm02 [2024/03/23 14:01] 127.0.0.1 edição externa |
cursos:planeco:roteiro:09-lm02 [2024/03/25 13:51] (atual) |
||
---|---|---|---|
Linha 355: | Linha 355: | ||
* ''age'': idade da mãe (anos) | * ''age'': idade da mãe (anos) | ||
* ''height'': altura da mãe (polegadas) | * ''height'': altura da mãe (polegadas) | ||
- | * ''weight'': peso da mãe (kg) | + | * ''weight'': peso da mãe (libras) |
* ''smoke'': 0 não fumante; 1 fumante | * ''smoke'': 0 não fumante; 1 fumante | ||
</WRAP> | </WRAP> | ||
- | Notem que as preditoras estão relacionadas a características da mãe: dias de gestação, idade, peso, altura e se ela é fumante ou não. Como a variável resposta, peso do bebê ao nascer, foi medida em ''onças'', vamos transformar em uma escala de medida que temos mais facilidade para interpretar, multiplicando essa variável por ''0.02835'' para transformar em ''kg''. | + | Notem que as preditoras estão relacionadas a características da mãe: dias de gestação, idade, peso, altura e se ela é fumante ou não. Como a variável resposta, peso do bebê ao nascer, foi medida em ''onças'', vamos transformar em uma escala de medida que temos mais facilidade para interpretar, multiplicando essa variável por ''0.02835'' para transformar em ''kg''. Vamos fazer o mesmo para o peso da mãe que foi medido em libras e deve ser multiplicada por ''0.453592'' para ser transformada em ''kg''. |
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
Linha 367: | Linha 367: | ||
* Garanta que os dados foram lidos corretamente; | * Garanta que os dados foram lidos corretamente; | ||
* Abra a janela para criar uma nova variável no menu ''Data > Manage variables in active data set > Compute a new variable''; | * Abra a janela para criar uma nova variável no menu ''Data > Manage variables in active data set > Compute a new variable''; | ||
- | * Na caixa ''New variable name'' nomei a nova variável como ''pesoKg''; | + | * Na caixa ''New variable name'' nomei a nova variável como ''bebeKg''; |
* Na caixa ''Expression to compute'' coloque a expressão: ''bwt * 0.02835''; | * Na caixa ''Expression to compute'' coloque a expressão: ''bwt * 0.02835''; | ||
+ | * Em seguida crie a variável ''maeKg'' multiplicando ''weight'' por ''0.453592''. | ||
</WRAP> | </WRAP> | ||
Linha 376: | Linha 377: | ||
<WRAP center round important 90%> | <WRAP center round important 90%> | ||
- | Para simplificar nosso exemplo, vamos deixar de lado duas variáveis preditoras que foram coletadas nesse estudo: ''parity'' e ''weight''. Ao final ficamos com quatro variáveis preditoras: | + | Para simplificar nosso exemplo, vamos deixar de lado duas variáveis preditoras que foram coletadas nesse estudo: ''parity'' e ''height''. Ao final ficamos com quatro variáveis preditoras: |
- | ''gestation'', ''age'', ''height'' e ''smoke'' | + | ''gestation'', ''age'', ''maeKg'' e ''smoke'' |
</WRAP> | </WRAP> | ||
Linha 389: | Linha 390: | ||
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
- | No menu ''Estatísticas > Ajustes de modelos > Modelo linear...'', construa o modelo ''lmFull'' com todas as quatro preditoras ((''gestation'', ''age'', ''height'' e ''smoke'')) e suas interações. O modelo resultante tem a seguinte expressão: | + | No menu ''Estatísticas > Ajustes de modelos > Modelo linear...'', construa o modelo ''lmFull'' com todas as quatro preditoras ((''gestation'', ''age'', ''maeKg'' e ''smoke'')) e suas interações. O modelo resultante tem a seguinte expressão: |
- | <code> pesoKg ~ age * gestation * height * smoke</code> | + | <code> bebeKg ~ age * gestation * maeKg * smoke</code> |
Na linguagem R os símbolos de ''*'' em expressões de notação de modelos representa tanto a variável isoladamente quanto as interações possíveis. | Na linguagem R os símbolos de ''*'' em expressões de notação de modelos representa tanto a variável isoladamente quanto as interações possíveis. | ||
Linha 413: | Linha 414: | ||
=== Combinatória === | === Combinatória === | ||
- | Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos 5 variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é: | + | Combinatória é a operação matemática para calcular de quantas maneiras conseguimos organizar ou combinar um conjuntos de elementos. No nosso caso, temos 4 variáveis e podemos nos perguntar de quantas formas podemos combinar esses elementos em diferentes conjuntos de dois a dois (interação dupla) ou três (interação tripla) e quatro (interação quadrupla)((Essa operação é chamada de combinatória simples, pois a ordem dos elementos nas combinações não importa)). A expressão matemática para essa operação é: |
$$C^{r}_{n} = \frac{n!}{r! (n-r)!} $$ | $$C^{r}_{n} = \frac{n!}{r! (n-r)!} $$ | ||
Linha 434: | Linha 435: | ||
- | * ''gestation:age:weight:smokeTRUE'' | + | * ''gestation:age:maeKg:smokeTRUE'' |
- | * ''age:gestation:height'' | + | * ''age:gestation:maeKg'' |
* ''age:gestation:smoke'' | * ''age:gestation:smoke'' | ||
- | * ''age:height:smoke'' | + | * ''age:maeKg:smoke'' |
- | * ''gestation:height:smoke'' | + | * ''gestation:maeKg:smoke'' |
As interações duplas: | As interações duplas: | ||
* ''age:gestation'' | * ''age:gestation'' | ||
- | * ''age:height'' | + | * ''age:maeKg'' |
* ''age:smoke'' | * ''age:smoke'' | ||
- | * ''gestation:height'' | + | * ''gestation:maeKg'' |
* ''gestation:smoke'' | * ''gestation:smoke'' | ||
- | * ''height:smoke'' | + | * ''maeKg:smoke'' |
Além dessas, temos os termos isolados para cada variável e o intercepto do modelo, totalizando os 16 termos do modelo ''lmFull''. | Além dessas, temos os termos isolados para cada variável e o intercepto do modelo, totalizando os 16 termos do modelo ''lmFull''. | ||
Linha 468: | Linha 469: | ||
* Produza o modelo nulo chamado ''lmNull'' com a formula: | * Produza o modelo nulo chamado ''lmNull'' com a formula: | ||
- | * ''pesoKg ~ 1'' | + | * ''bebeKg ~ 1'' |
* compare com o modelo cheio produzido acima ''lmFull'' utilizando a função: | * compare com o modelo cheio produzido acima ''lmFull'' utilizando a função: | ||
* ''anova(lmNull, lmFull)'' | * ''anova(lmNull, lmFull)'' | ||
Linha 481: | Linha 482: | ||
- | ''age:gestation:height:smoke[T.TRUE]'' | + | ''age:gestation:maeKg:smoke[T.TRUE]'' |
Linha 498: | Linha 499: | ||
===== Modelo Cheio ===== | ===== Modelo Cheio ===== | ||
- | Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações), podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "muita" experiência sobre tamanhos de bebes ao nascer, "consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são: | + | Depois de definir quais são os termos que queremos incluir no nosso modelo (variáveis simples e interações), podemos iniciar o procedimento de modelagem seguindo algum protocolo para chegar ao modelo mínimo adequado. No nosso caso, iremos partir do modelo cheio, simplificar até o mínimo adequado. Como não temos experiência prévia do sistema e não temos "muita" experiência sobre tamanhos de bebês ao nascer, "consultamos vários especialistas na área" e eles chegaram à conclusão que os termos que deveriam ser contemplados são: |
- | ''pesoKg ~ gestation + age + weight + smoke + gestation:age + gestation:smoke + | + | ''bebeKg ~ gestation + age + maeKg + smoke + gestation:age + gestation:smoke + |
- | age:weight + age:smoke + weight:smoke + gestation:age:smoke '' | + | age:maeKg + age:smoke + maeKg:smoke + gestation:age:smoke '' |
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
+ | |||
==== Seleção do mínimo adequado ==== | ==== Seleção do mínimo adequado ==== | ||
Linha 510: | Linha 512: | ||
- | <code> bwt ~ gestation + age + weight + smoke + | + | <code> bebeKg ~ gestation + age + maeKg + smoke + |
gestation:age + gestation:smoke + | gestation:age + gestation:smoke + | ||
- | age:weight + age:smoke + weight:smoke + | + | age:maeKg + age:smoke + maeKg:smoke + |
gestation:age:smoke | gestation:age:smoke | ||
</code> | </code> | ||
+ | |||
* simplifique esse modelo até o mínimo adequado; | * simplifique esse modelo até o mínimo adequado; | ||
+ | |||
<WRAP center round tip 80%> | <WRAP center round tip 80%> | ||
+ | |||
Durante o processo de simplificação, quando nos defrontamos com vários termos de mesma ordem não significativos, um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos, ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo" em um modelo mais complexo pode se tornar "significativo" em um modelo mais simples. | Durante o processo de simplificação, quando nos defrontamos com vários termos de mesma ordem não significativos, um bom procedimento é retirar um deles de cada vez e, mesmo que o termo não seja retido no modelo, retorna-lo ao modelo antes de retirar o outro. Caso a ordem de retirada não torne nenhum dos termos significativos, ambos podem ser retirados. No caso de serem mais do que dois termos de mesma ordem, é importante também testar a retirada de dois a dois termos depois do procedimento de retirada de um a um não ter tornado nenhum termo significativo. Isso garante que a ordem de retirada não define o termo que será retido no modelo. Lembre-se que um termo "não significativo" em um modelo mais complexo pode se tornar "significativo" em um modelo mais simples. | ||
+ | |||
</WRAP> | </WRAP> | ||
- | * interprete o resultado do modelo mínimo adequado com relação aos termos selecionados; | + | * qual a predição do modelo selecionado do peso do bebê das seguintes mães: |
- | * interprete o resultado biologicamente. | + | * 26 anos, 280 dias de gestação, peso 55 kg e não fumante |
+ | * 26 anos, 280 dias de gestação, peso 55 kg e fumante | ||
+ | * 26 anos, 210 dias de gestação, peso 55 kg e não fumante | ||
+ | * 26 anos, 210 dias de gestação, peso 55 kg e fumante | ||
+ | * 26 anos, 280 dias de gestação, peso 70 kg e não fumante | ||
+ | * 26 anos, 280 dias de gestação, peso 70 kg e fumante | ||
+ | * 26 anos, 210 dias de gestação, peso 70 kg e não fumante | ||
+ | * 26 anos, 210 dias de gestação, peso 70 kg e fumante | ||
+ | * faça as mesmas predições acima, agora para uma mãe com 35 anos; | ||
+ | * coloque as características da mãe e as predições do modelo para os casos acima em um planilha ((essa planilha pode ser feita no R como um ''data.frame'', exportando depois como ''csv'')); | ||
+ | * interprete o resultado do modelo biologicamente. | ||
</WRAP> | </WRAP> | ||
Linha 529: | Linha 545: | ||
==== Tamanho e sobrepeso da mãe ==== | ==== Tamanho e sobrepeso da mãe ==== | ||
- | Um "outro especialista" ao analisar o modelo mínimo adequado selecionado acima afirmou que deveria incluir a variável ''height'' para controlar o peso do bebe ser maior apenas porque a mãe era grande. Além disso sugeriu incluir uma nova variável que indicasse a quanto a gestante tem de sobrepeso ou subpeso. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como respotas e a variável altura como preditora. Todos os "outros especialistas" concordaram que essa era uma boa sugestão, já que essa nova variável representa o quanto a gestante tem mais peso ou menos peso do que esperado para uma gestante com a sua altura. | + | Um "outro especialista", ao analisar o modelo mínimo adequado selecionado acima, afirmou que a variável ''height'' deveria ser incluida para controlar o peso do bebê ser maior apenas porque a mãe era grande. Além disso, sugeriu incluir uma nova variável que indicasse a quanto a mãe tem de sobrepeso ou subpeso antes de engravidar. Indicou ainda que uma forma de criar essa variável seria utilizar os resíduos de uma regressão simples da variável peso como resposta e a variável altura como preditora. Todos os "outros especialistas" concordaram que eram uma boa sugestão, já que essa nova variável representa o quanto a mãe tem mais peso ou menos peso do que esperado para uma mãe com a mesma altura. |
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
Linha 538: | Linha 554: | ||
* cronstrua um segundo modelo que inclua ''resPeso'' agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores; | * cronstrua um segundo modelo que inclua ''resPeso'' agora como o último termo no modelo mínimo adequado selecionado nos passos anteriores; | ||
* compare os resumos de ambos os modelos e anote as diferenças encontradas; | * compare os resumos de ambos os modelos e anote as diferenças encontradas; | ||
- | * no menu ''Estatísticas'' > ''Resumos'' > ''Teste de correlação'' selecione as variáveis ''resPeso'' e ''weight'', anote o valor da correlação entre essas variáveis; | + | * no menu ''Estatísticas'' > ''Resumos'' > ''Teste de correlação'' selecione as variáveis ''resPeso'' e ''maeKg'', anote o valor da correlação entre essas variáveis; |
{{ :cursos:planeco:roteiro:corPeso.png?700 |}} | {{ :cursos:planeco:roteiro:corPeso.png?700 |}} | ||
* a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante; | * a partir da avaliação da correlação acima tome a decisão de reter ambas, uma ou nenhuma das duas variáveis do passo acima, justifique sua decisão e construa o modelo resultante; | ||
Linha 632: | Linha 648: | ||
<WRAP center round help 90%> | <WRAP center round help 90%> | ||
- | Responda o [[https://forms.gle/qZg13LsMEG2xHRAe6|o formulário MLM III]] incluindo arquivos de resultados e figuras quando solicitado. | + | Responda o [[https://forms.gle/wBbBoyssUMqSmurL8|o formulário MLM I]] incluindo arquivos de resultados quando solicitado. |
- | |||
- | {{url>https://forms.gle/qZg13LsMEG2xHRAe6}} | ||
</WRAP> | </WRAP> | ||
Linha 705: | Linha 719: | ||
+ | |||
+ | /* | ||
==== O que preciso entregar ==== | ==== O que preciso entregar ==== | ||
Linha 719: | Linha 735: | ||
{{url>https://forms.gle/LvN2j8iE7JWpeEBr9}} | {{url>https://forms.gle/LvN2j8iE7JWpeEBr9}} | ||
+ | */ |