RNA.seq pacote:unknown R Documentation ~~ Processa e analisa dados brutos de contagem de genes e compara diferentes condições experimentais~~ Descrição: Utiliza dados brutos de contagem de genes, oriundos de experimentos de sequenciamento de RNA em larga escala, analisando-os e comparando diferentes condições experimentais. Uso: RNA.seq(data, ncon) Argumentos: data data frame ou matriz com os dados brutos de contagem de genes. ncon número de condições experimentais a serem analisadas. Detalhes: O data frame com os dados deve ser importado utilizando header = TRUE, sendo que os genes devem estar indicados nas linhas e as condições experimentais nas colunas. Valor: “HeatMaps.pdf”: retorna um arquivo do tipo .pdf com dois gráficos do tipo HeatMap, sendo o primeiro comparando as condições experimentais baseando-se nos valores de uma matriz de distância e o segundo comparando as condições baseando-se nos seus respectivos valores normalizados de contagem de genes. “plotMA.pdf”: retorna um arquivo do tipo .pdf com gráficos de dispersão utilizando valores de comparação de dados de contagem normalizados entre duas variáveis; todas as variáveis serão comparadas entre si, duas a duas. “baseMeans.txt”: retorna um arquivo do tipo .txt contendo uma tabela com os valores de baseMeans e baseVar para cada gene analisado. “RPKM.txt”: retorna um arquivo do tipo .txt contendo uma tabela com os valores de contagem de genes normalizados segundo o cálculo de RPKM (Reads Per Kilobase per Million mapped reads). “binomtest[i,j].txt”: retorna um arquivo do tipo .txt contendo uma tabela com dados obtidos de comparações entre duas das variáveis analisadas. Será gerado um arquivo para cada comparação separadamente; ”i” e “j” correspondem às variáveis a serem comparadas. Autor: Paulo Marques Pierry Doutorando do Programa de Pós-graduação em Ciências, Área Bioquímica, do IQ/USP. pmpierry@gmail.com Agradecimentos: Agradeço aos monitores da disciplina Marilia Gaiarsa, Danilo Muniz e Hamanda Cavalheri pela fundamental ajuda durante o desenvolvimento desta função. Referências: Gentleman, R.C., Carey, V.J., Bates, D.M., Bolstad, B., Dettling M., Dudoit, S., Ellis, B., Gautier, L., Ge, Y., Gentry, J., Hornik, K., Hothorn, T., Huber, W., Iacus, S., Irizarry, R., Leisch, F., Li, C., Maechler, M., Rossini, A.J., Sawitzki, G., Smith, C., Smyth, G., Tierney, L., Yang, J.Y.H., Zhang, J. 2004. Bioconductor: open software development for computational biology and bioinformatics. Genome Biology, 5:R80. Anders, S., Huber, W. 2010. Differential expression analysis for sequence count data. Genome Biology, 11:R106. Exemplo: # Baixar os arquivos "teste_vibrio_mean.csv" e "gene.coord.csv" e salvá-los no diretório de trabalho que será usado no R. # “teste_vibrio_mean.csv”: contagem de genes expressos em diferentes condições de crescimento da bactéria patogênica Vibrio cholerae tanto in vivo como in vitro. # “gene.coord.csv”: coordenadas gênicas de todos os genes analisados da bactéria Vibrio cholerae. data <- read.table("teste_vibrio_mean.csv", header=T, sep=";") gene.coord <- read.table("gene.coord.csv", header=T, sep=";") #Analisar os dados de expressão gênica de cinco condições experimentais de crescimento da bactéria Vibrio cholerae. RNA.seq(data, 5) Referência dos dados do exemplo: Mandlik, A., Livny, J., Robins, W.P., Ritchie, J.M., Mekalanos, J.J., Waldor, M.K. 2011. RNA-Seq-Based Monitoring of Infection-Linked Changes in Vibrio cholerae Gene Expression. Cell Host & Microbe, 10:165-174.