## Uma estimativa da incerteza na previsao do modelo ##

babies <- read.table(file = "babies.txt", header = TRUE, sep = "", as.is = TRUE)
summary(babies)

babies$gestation[babies$gestation == 999] = NA
babies$weight[babies$weight == 999] = NA
babies$parity[babies$parity == 9] = NA
babies$age[babies$age == 99] = NA
babies$height[babies$height == 99] = NA
babies$smoke[babies$smoke == 9] = NA
summary(babies)

#Converção do peso para kg
babies$bwt <- babies$bwt*0.0283495 
#Modelo peso - tempo gestação
lm.babies <- lm(babies$bwt~babies$gestation) 

#Vetor para representar a variável preditora como uma sequência de 100 valores 
#compreendidos entre os valores máximo e mínimo da variavel preditora observada
vetor.seq100 <- seq(from=148, to=353,length.out=100)
vetor.seq100
coef(lm.babies) 
babies1 <- coef(lm.babies)[1] + coef(lm.babies)[2]*vetor.seq100
babies1

#SSX Desvios quadraticos sem NAs
ssx <- sum((na.omit(babies$gestation) - mean(babies$gestation, na.rm=TRUE))^2)
ssx

#Variancia de bwt 
s2 <-var(babies$bwt)

#N de observações 
n <- length(na.omit(babies$gestation))

#Média de x 
x.media <- mean(babies$gestation, na.rm=TRUE)
x.media

#Erro padrao 
erro <- sqrt((((vetor.seq100 - x.media)^2/ssx)+(1/n))*s2)
erro

#Calculo t: 
t <- qt(0.975, (n-2))

int.conf <- t*erro
int.conf

#Gráfico da incerteza do modelo
plot(bwt~gestation, data=babies, xlab="Tempo de gestação (dias)", ylab="Peso do bebê (kg)") 
abline(lm.babies)
lines(vetor.seq100, (babies1+erro), col="red")
lines(vetor.seq100, (babies1-erro), col="red")


###Galileu estava certo? 

#Ajuste de Polinomios 
init.h = c(600, 700, 800, 950, 1100, 1300, 1500)
h.d = c(253, 337, 395, 451, 495, 534, 573)
#Modelo 1 - reta
mod1 <- lm(h.d~init.h) 
#Modelo 2 - parabola
mod2 <- update(mod1,.~. +I(init.h^2)) 
#Comparação Modelos 1 e 2
anova(mod1, mod2) 

#Avalie se um polinomio de terceiro grau e um melhor modelo para descrever os 
#dados do experimento de Galileu
#Modelo 3
mod3 <- update(mod2,.~. +I(init.h^3))
anova(mod2, mod3)

#O experimento de Galileu é melhor descrito pelo modelo 3 (polinomio terceiro grau) 
#pois nele mais dados são explicados significativamente do que no modelo anterior
#(segundo grau) o qual já explicava também mais dados que o primeiro modelo 
#(primeiro grau).