Exercícios de Leitura e Manipulação de Dados
Distância entre cidades
Releia1) o tópico sobre matrizes na seção sobre entrada de dados da apostila online.
Abaixo as distâncias por estradas entre quatro cidades da Europa, em quilômetros:
- Atenas a Madri: 3949
- Atenas a Paris: 3000
- Atenas a Estocolmo: 3927
- Madri a Paris: 1273
- Madri a Estocolomo: 3188
- Paris a Estocolmo: 1827
- Construa uma matriz de distâncias com esses valores.
- Compare sua matriz com o objeto
eurodist, disponível no pacotedatasets.
DICA: as funções lower.tri, upper.tri e diag podem lhe ajudar.
Criação de um data frame
Imagine um experimento em que hamsters de dois fenótipos (claros e escuros) recebem três tipos diferentes de dieta, e no qual as diferenças dos pesos (g) entre o fim e o início do experimento sejam:
| DIETA A | DIETA B | DIETA C | |
|---|---|---|---|
| CLAROS | 0.1 , 1.1 , 3.7 | 5.7, -1.2, -1.5 | 3.0, -0.4, 0.6 |
| ESCUROS | 1.5, -0.1, 2.0 | 0.6, -3.0, -0.3 | -0.2, 0.3, 1.5 |
- Crie um data frame com esses dados, na qual cada hamster seja uma linha, e as colunas sejam as variáveis cor, dieta e variação do peso.
- Qual a media por dieta e por fenótipo?
DICA: Use as funções de gerar repetições para criar os vetores dos tratamentos.
Criando uma Matriz
- Crie um objeto da classe matriz com 5 colunas e 3 linhas contendo uma amostra de uma distribuição normal de média 10 e variância 3,6.
- Mude os nomes das linhas para “L1” a “L3” e das colunas para “C1” a “C5”. Dica: A função paste combinada com funções de repetições podem lhe poupar trabalho.
- Calcule a média e a variância por colunas e depois por linhas. Guarde os resultados em um dataframe , cujas colunas são a média e a variância de cada subconjunto dos dados.
Lendo e Salvando seus dados
- Leia um arquivo de dados de sua autoria e faça um sumário das variáveis independentes. Caso tenha variáveis qualitativas faça tabelas de contagem para cada uma e duas a duas. Caso não tenha dados, poderá ir a campo ou utilize alguns dos dados da área Arquivos de dados do nosso wiki
. Dica: veja o help da função read.table()
- Faça uma seleção de um estado de atributo de um vetor fator dos seus dados e salve em um objeto (uma espécie, uma localidade…), mantendo o objeto original intacto. Em seguida selecione apenas três colunas no objeto resultante e salve em um arquivo de formato .txt, separado por tabulação e sem nome de linhas. Lembre-se de olhar o help antes de surtar! Para verificar se o arquivo está correto abra-o no EXCEL, URGG!
Classes de Objetos
O pacote “datasets” contém vários conjuntos de dados para uso em treinamento com a linguagem R.
O conjunto “iris” é distribuído de duas formas diferentes, nos objetos iris e iris3. São quatro medidas de flores de três espécies de Iris (Iridaceae).
- Quais são as classes desses dois objetos?
- Calcule a média de cada uma das quatro medidas por espécie, dos dois objetos. DICAS: as funções da família
applye a funçãobyirão te ajudar. - Os nomes das variaveis estão em inglês. Mude-os para português no objeto
iris. DICA: Como tudo mais no R, os resultados da funçãonamespodem ser armazenados em um objeto.
Acrescentando Dados de Síntese
- Crie um objeto com os dados do arquivo-texto Biomassa de Árvores de Eucalyptus saligna.
- Verifique o conteúdo do objeto resultante, com a função
summary. - Acrescente uma nova coluna ao data frame resultante, com a soma das biomassas de folhas e do tronco de cada árvore.
- Acrescente outra coluna, com o valor da área basal de cada árvore.
- Calcule a área basal total por talhão e salve em um objeto
- Calcule a média da área basal por talhão
- Selecione apenas os dados relativos à árvores com mais de 10 cm de diâmetro
- Salve em um arquivo txt, separado por tabulação.
UFA!