Os três parâmetros estruturais básicos das comunidades são a riqueza, composição e abundância (de espécies, tipos funcionais, linhagens …). Podemos tentar entender as comunidades analisando cada uma de suas partes (por exemplo as populações de cada espécie) ou podemos tentar analisar o conjunto de espécies como um todo.
Uma das abordagens da ecologia de comunidades é buscar regularidades nestes parâmetros estruturais, e propor explicações para eles. Neste roteiro vamos aprender uma das ferramentas estatísticas usadas para isto, chamada partição de variação.
Aqui vamos analisar a estrutura espacial da abundância de uma espécie fictícia. Começamos com apenas uma espécie porque isso facilita entender os cálculos e suas interpretações. No roteiro seguinte mostraremos como a partição pode ser generalizada para descrever padrões conjuntos de abundância de muitas espécies.
Para começar, copie para sua pasta de trabalho o arquivo com os dados que vamos usar:
Agora vamos importar para o R os dados que você gravou em seu diretório. Para isso copie o comando abaixo, cole na linha de comando do R e pressione “enter”:
dados <- read.csv2("roteiro1.csv")
Se não houve nenhuma mensagem de erro agora você tem no R uma tabela com 100 linhas e três colunas, que explicaremos a seguir. Se quiser verificar se a tabela foi importada, você pode usar os comandos seguintes para mostrar suas primeiras e últimas linhas:
head(dados) tail(dados)
A abundância de uma espécie pode variar muito, no tempo e no espaço. A pergunta fundamental aqui é o que causa essa variação. A partição de variância é um método para avaliar o quanto da variação de uma quantidade pode ser atribuída à variação de uma outra quantidade. Usamos este método, por exemplo, para avaliar se é plausível que a abundância de uma planta em uma área varie em função da variação de um fator ambiental.
Vamos aos nossos dados, para deixar mais concreto. A figura abaixo representa uma parcela permanente, que foi dividida em 100 quadrados. Em cada quadrado foram contados todos os indivíduos de Non illum, uma erva daninha invasora. A abundância da planta por quadrado vai de dois indivíduos (cinza claro) até 41 indivíduos (cor preta).
Percebendo a concentração de plantas no canto superior direito da parcela, uma ecóloga propôs a hipótese de que a planta tem uma associação com solos menos ácidos. Ela chegou a essa hipótese porque havia medido o pH do solo superficial em cada parcela, o que usou para fazer o mapa a seguir (à direita). Neste mapa, cores claras são valores mais baixos de pH e cores escuras valores altos.
Parece razoável? Para avaliar melhor isto vamos fazer um gráfico da relação entre a abundância da planta e o valor do pH em cada parcela. Já importamos esses dados para o R na seção anterior, então temos só que dar o comando que cria o gráfico:
plot(abund ~ pH, data = dados)
O gráfico sugere que a abundância da planta é proporcional ao pH. Se isso é verdade, deve haver uma linha reta que aproxime bem essa relação. A regressão linear é uma técnica estatística para encontrar essa reta. Execute no R o comando para ajustar a regressão da abundância em função do pH:
regr.pH <- lm(abund ~ pH, data = dados)
E adicione a linha da regressão ao seu gráfico com o comando abaixo:
abline(regr.pH)
A regressão linear nos retorna muita informação importante sobre a relação que hipotetizamos. A que mais nos interessa agora é o coeficiente de determinação, expresso pela sigla R2. Este coeficiente expressa a proporção da variação total da variável resposta (a abundância, no caso) que é “capturada” ou “explicada” pela variação da variável explanatória (o pH, no caso). Para entender o R2 veja o roteiro sobre coeficiente de determinação.
Para obter o R2 da regressão que ajustamos acima basta o comando1):
(X<-summary(regr.pH)$r.squared)
O que mostra que 68,6% da variação da abundância da espécie é explicada por uma relação linear com o pH do solo superficial.
Uma outra ecóloga sabia que a invasão por Non illum era recente e havia começado pelo canto superior direito da parcela por sementes trazida acidentalmente por tucanos, que desapareceram em seguida 2). A ecóloga então propôs que quadrados mais distantes do ponto de entrada tiveram menor chance de serem colonizados. Essa hipótese propõe que a variação observada na abundância dessa planta na parcela é resultado apenas da limitação à dispersão. A ecóloga criou então um mapa para expressar sua hipótese. Neste mapa (à direita) os quadrados com maior chance de receber propágulos estão em tons mais escuros:
Esse mapa é construído atribuindo um valor a cada quadrado, que deve expressar um índice de abundância esperada, relativa aos demais quadrados. No caso, esse índice pode ser interpretado como proporcional à probabilidade de estabelecimento de um propágulo. A limitação à dispersão se expressa pelo arranjo espacial de áreas com alta e baixa probabilidade de estabelecimento, de acordo com algum modelo de dispersão ou estabelecimento. Nesse caso o modelo é bem simples: quanto mais distante do vértice superior direito, menor a chance de estabelecimento. Por isso vamos chamar o índice usado para construir o mapa de variável de estrutura espacial.
Compare o mapa da direita com o mapa de variação da abundância da planta (esquerda). Será que a limitação à dispersão proposta é uma boa hipótese? Para ajudar, faça o gráfico da abundância em função da variável de estrutura espacial (que estão na coluna chamada “space” na nossa tabela de dados), utilizando o comando:
plot(abund ~ space, data= dados, xlab = "Variável de estrutura espacial", ylab= "Abundância de N. illum")
Para testar esta nova hipótese ajustamos a regressão da abundância em função da variável espacial:
regr.space <- lm(abund ~ space, data = dados)
E podemos adicionar a linha da regressão ao gráfico:
abline(regr.space)
Agora, vamos obter a fração da variação da abundância explicada pela variável espacial utilizando o comando que já conhecemos, aplicado ao objeto “regr.space” que tem os resultados da regressão. Vamos guardar esse valor no objeto “W”:
(W <- summary(regr.space)$r.squared)
Resumindo o que encontramos até aqui: uma variável ambiental (pH) explica 68,6% da variação da abundância da espécie. Mas uma variável de estrutura espacial explica 49,2% desta mesma variação. Como é possível que a soma dos percentuais de variação explicada passe de 100% ?
A resposta é que há uma relação entre o pH e a variável de estrutura espacial:
plot(pH ~ space, data = dados, xlab = "Variável de estrutura espacial")
O que significa que a variável ambiental tem uma estrutura espacial, que é bem descrita pela estrutura espacial proposta pela segunda hipótese. Assim, a variação explicada pelo pH contém uma parte de efeito espacial. Da mesma forma, uma parte da variação explicada pela variável espacial contém efeito do pH.
A essa parte da variação compartilhada chamamos variação ambiental estruturada no espaço. No esquema abaixo essa parte da variação explicada é o componente b.
O círculo da esquerda representa a variação explicada por uma variável X, no caso a variável ambiental. Vemos que a variação explicada por X é a soma do mesmo componente compartilhado b com um componente a que chamamos fração de variância explicada apenas pelo ambiente.
Da mesma forma, o círculo da direita representa a variação explicada por uma segunda variável W, no caso o espaço. Vemos que W é formado pelo componente compartilhado com a outra variável (b) e por uma outra fração c, que chamamos de fração de variância explicada apenas pelo espaço.
Por fim, a variação total é representada pelo retângulo. A parte não coberta pelos círculos é a variação que não é explicada por nenhuma variável, indicada por d.
A variação não explicada por nenhuma variável é obtida a partir de uma regressão que inclui todas as variáveis (no nosso caso, pH e estrutura espacial):
regr.tudo <- lm(abund ~ pH + space, data = dados)
Da qual podemos obter a variação explicada pelo pH e pela variável espacial juntas:
summary(regr.tudo)$r.squared
Esta quantidade corresponde a a+b+c no diagrama acima, que vamos chamar de XW.
Sabendo que
a+b+c+d = XW+d = 1
temos então que
d=1−XW
e assim, obtemos d subtraindo de um (1,0) o valor calculado acima
(d <- 1 - summary(regr.tudo)$r.squared)
Agora temos todas as peças que precisamos para calcular como a variação da abundância de Non illum pode ser particionada entre os componentes do diagrama acima:
{a+b=Xc+b=Wa+b+c=1−d
O que implica em
d+X+W−1=b
Usando os valores que já calculamos e guardamos no R temos então:
Fração devido a espaço e pH (b)
(b <- X + W + d - 1)
Fração devido apenas a pH (a)
(a <- X - b)
Fração devido apenas a espaço (c)
(c <- W - b)
Fração não explicada (d)
d
Qual hipótese tem mais apoio dos resultados?