Aqui você vê as diferenças entre duas revisões dessa página.
Ambos lados da revisão anterior Revisão anterior Próxima revisão | Revisão anterior | ||
cursos:planeco:roteiro:08-lm_base [2024/03/05 17:50] 127.0.0.1 edição externa |
cursos:planeco:roteiro:08-lm_base [2024/03/20 17:36] (atual) |
||
---|---|---|---|
Linha 256: | Linha 256: | ||
==== Esforço Amostral ==== | ==== Esforço Amostral ==== | ||
- | Uma outra fonte de imprecisão nas estimativas do no nosso modelo tem relação com o próprio desenho experimental e está associada ao tamanho da nossa amostra. Essa fonte de imprecisão, apesar de acoplada à variabilidade do sistema, pode ser minimizada com o aumento do esforço amostral. Vamos simular uma amostra maior para os dados simulados do **Modelo I** onde o desvio padrão da população é <wrap hi>7</wrap>. Para aumentar o esforço amostral vamos modificar a sequência de valores de ''x'' na amplitude de 0,5 a 7,5 para intervalos de 0,14, totalizando 51 observações na nossa amostra. | + | Uma outra fonte de imprecisão nas estimativas do nosso modelo tem relação com o próprio desenho experimental e está associada ao tamanho da nossa amostra. Essa fonte de imprecisão, apesar de acoplada à variabilidade do sistema, pode ser minimizada com o aumento do esforço amostral. Vamos simular uma amostra maior para os dados simulados do **Modelo II** onde o desvio padrão da população é <wrap hi>14</wrap>. Para aumentar o esforço amostral vamos modificar a sequência de valores de ''x'' na amplitude de 0,5 a 7,5 para intervalos de 0,14, totalizando 51 observações na nossa amostra. |
- | Note que nessa nova simulação de dados não há nenhuma modificação do nosso sistema ou do modelo matemático subjacente. Todos os parâmetros da população e sua variabilidade intrínseca permanecem os mesmos da primeira simulação de dados (Modelo I). A única modificação é no desenho experimental onde o esforço amostral foi aumentado. | + | Note que nessa nova simulação de dados não há nenhuma modificação do nosso sistema ou do modelo matemático subjacente. Todos os parâmetros da população e sua variabilidade intrínseca permanecem os mesmos da segunda simulação de dados (Modelo II). A única modificação é no desenho experimental onde o esforço amostral foi aumentado. |
<WRAP center round box 80%> | <WRAP center round box 80%> | ||
+ | |||
Para agilizar a construção desta sequência podemos criar um valor de referência para as observações de 0 a 50 e operar esse valor de referência. | Para agilizar a construção desta sequência podemos criar um valor de referência para as observações de 0 a 50 e operar esse valor de referência. | ||
- | * na célula **//A2//** inicie em ''0'' e crie uma sequencia de inteiros até ''50'' (célula **//A51//**); | + | * na célula **//A2//** inicie em ''0'' e crie uma sequencia de inteiros até ''50'' (célula **//A51//**), nomei essa coluna de ''seq''; |
- | * na célula **//B2//** coloque a fórmula ''=0.5+(1.4*A2)'' e copie a fórmula para todas a coluna até a célula **//B51//**; | + | * na célula **//B2//** coloque a fórmula ''=0.5+(0.14*A2)'' e copie a fórmula para todas a coluna até a célula **//B51//** isso irá criar nossa nova variável ''x''; |
- | * a partir deste ponto é só seguir os passos da simulação anterior; | + | * na coluna **//C//** crie a variável ''y1'' com a mesma formula do modelo anterior ''= 4 + 3.5 * B2''; |
+ | * a partir deste ponto é só seguir os passos da simulação anterior notando que a variável ''y1'' agora está na coluna ''C''; | ||
* garanta que calculou os desvios com ''INV.NORM.N(ALEATÓRIO(); 0 ; 14)'', como no exemplo anterior; | * garanta que calculou os desvios com ''INV.NORM.N(ALEATÓRIO(); 0 ; 14)'', como no exemplo anterior; | ||
* salve os dados simulados em um arquivo para uso posterior; | * salve os dados simulados em um arquivo para uso posterior; | ||
Linha 290: | Linha 292: | ||
- | Por exemplo, no nosso exemplo de anova que contenha a variável preditora ''solo'' com os níveis: ''arenoso'', ''argiloso'' e ''heúmico'', cada nível seria representada pelas indicadoras da seguinte forma: | + | No nosso exemplo de anova a variável preditora ''solo'' tinha os níveis: ''arenoso'', ''argiloso'' e ''húmico''.Neste caso, cada nível de ''solo'' seria representada pelas indicadoras da seguinte forma: |
<WRAP center round box 60%> | <WRAP center round box 60%> | ||
Linha 303: | Linha 305: | ||
</WRAP> | </WRAP> | ||
- | O resultado deste modelo irá apresentar um intercepto e dois coeficientes, um associado ao nível ''argilos'', outro ao nível ''húmico''. O nível ''arenoso'', não contemplado com uma variável indicadora ((representado por ''00'' nas outras indicadoras)) é estimado no intercepto. Essa estimativa do intercepto, no caso do exemplo apresentado na aula de anova, representa a produção média nesse tipo de solo. Os outros coeficientes apresentados pelo modelo representam o quanto os solos ''argiloso'' ou ''húmico'' são em média diferentes do ''arenoso''. Vamos criar um modelo e interpretar os coeficientes em um conjunto de dados que tem a variável ''solo'' agora com quatro níveis. | + | O resultado deste modelo irá apresentar um intercepto e dois coeficientes, um associado ao nível ''argiloso'', outro ao nível ''humico''. O nível ''arenoso'', não contemplado com uma variável indicadora ((representado por ''00'' nas outras indicadoras)) é estimado no intercepto. Essa estimativa do intercepto, no caso do exemplo apresentado na aula de anova, representa a produção média nesse tipo de solo. Os outros coeficientes apresentados pelo modelo representam o quanto os solos ''argiloso'' ou ''humico'' são em média diferentes do ''arenoso''. Vamos criar um modelo e interpretar os coeficientes em um conjunto de dados que tem a variável ''solo'' agora com quatro níveis. |
Linha 309: | Linha 311: | ||
* baixe o arquivo {{ :planeco:roteiro:colheita.csv |}}; | * baixe o arquivo {{ :planeco:roteiro:colheita.csv |}}; | ||
* abra no excel; | * abra no excel; | ||
- | * note que a variável ''solo'' tem agora 4 níveis: ''arenoso'', ''argiloso'', ''húmico'' e ''alagado''; | + | * note que a variável ''solo'' tem agora 4 níveis: ''arenoso'', ''argiloso'', ''humico'' e ''alagado''; |
* calcule a média de produtividade para cada tipo de ''solo''; | * calcule a média de produtividade para cada tipo de ''solo''; | ||
* Importe o arquivo original ''colheita.csv'' para o Rcommander; | * Importe o arquivo original ''colheita.csv'' para o Rcommander; | ||
Linha 327: | Linha 329: | ||
<WRAP center round box 100%> | <WRAP center round box 100%> | ||
* abra o arquivo {{ :planeco:roteiro:colheita.csv |colheita.csv}} no excel; | * abra o arquivo {{ :planeco:roteiro:colheita.csv |colheita.csv}} no excel; | ||
- | * crie 3 novas colunas nomeadas de: ''arenoso'', ''argiloso'', ''húmico''. | + | * crie 3 novas colunas nomeadas de: ''arenoso'', ''argiloso'', ''humico''. |
- | * para cada observação (linha) represente o nível do solo com o valor ''1'' na respectiva indicadora e ''0'' nas outras. Note que um nível não precisa de indicadora pois será representado pela indicação de ''0'' em todas as indicadoras, no nosso caso o nível ''alagado'' ((os valores ''0;0;0'' ''1;0;0'', ''0;1;0'' e ''0;0;1'' em cada indicadora representam respectivamente: ''alagado'',''arenoso'', ''argiloso'' e ''húmico'')); | + | * para cada observação (linha) represente o nível do solo com o valor ''1'' na respectiva indicadora e ''0'' nas outras. Note que um nível não precisa de indicadora pois será representado pela indicação de ''0'' em todas as indicadoras, no nosso caso o nível ''alagado'' ((os valores ''0;0;0'' ''1;0;0'', ''0;1;0'' e ''0;0;1'' em cada indicadora representam respectivamente: ''alagado'',''arenoso'', ''argiloso'' e ''humico'')); |
* salve a planilha no formato ''.csv''; | * salve a planilha no formato ''.csv''; | ||
* importe essa planilha com as variáveis indicadoras para o Rcommander; | * importe essa planilha com as variáveis indicadoras para o Rcommander; | ||
Linha 552: | Linha 554: | ||
* monte uma tabela de ANOVA com as somas quadráticas como no [[cursos:planeco:roteiro:07-classrcmdr#anovaanalise_de_variancia|tutorial de anova]]; | * monte uma tabela de ANOVA com as somas quadráticas como no [[cursos:planeco:roteiro:07-classrcmdr#anovaanalise_de_variancia|tutorial de anova]]; | ||
- | <WRAP center round tip 80%> | + | <WRAP center round tip 90%> |
Linha 574: | Linha 576: | ||
</WRAP> | </WRAP> | ||
+ | |||
* Calcule o p-valor associado à estatística F do modelo | * Calcule o p-valor associado à estatística F do modelo | ||
<WRAP center round tip 90%> | <WRAP center round tip 90%> | ||
- | Utilize no excel o valor ** 1- DIST.F(F, df1, df2, VERDADEIRO)((F.DIST no LibreOffice))** para o calculo do p-valor sendo F o valor da estatística F calculada, ''df1'' o grau de liberdade da regressão (normalmente 1) e ''df2'' o valor de graus de liberdade do cálculo dos desvios quadráticos médios dos resíduos (''n - 2''). | + | Utilize no excel o valor ''1- DIST.F(F, df1, df2, VERDADEIRO)((F.DIST no LibreOffice))'' para o cálculo do p-valor sendo F o valor da estatística F calculada, ''df1'' o grau de liberdade da regressão (normalmente ''1'') e ''df2'' o valor de graus de liberdade do cálculo dos desvios quadráticos médios dos resíduos (''n - 2'') que é o número de observações menos dois graus relativos ao cálculo do intercepto e da inclinação. |
</WRAP> | </WRAP> | ||