Skip to content

Latest commit

 

History

History
70 lines (43 loc) · 2.07 KB

DESeq2使用指南.md

File metadata and controls

70 lines (43 loc) · 2.07 KB

目录

DESeq2使用指南

DESeq2使用指南

导入数据 目录

用tximport导入定量数据 (salmon) 目录

将由salmon quant产生的quant.sf 文件导入,然后构建gene-level DESeqDataSet object

先根据样本信息构建以下格式的数据框变量samples

# samples

##           pop center       run condition
## ERR188297 TSI  UNIGE ERR188297         A
## ERR188088 TSI  UNIGE ERR188088         A
## ERR188329 TSI  UNIGE ERR188329         A
## ERR188288 TSI  UNIGE ERR188288         B
## ERR188021 TSI  UNIGE ERR188021         B
## ERR188356 TSI  UNIGE ERR188356         B

run和condition两列是必须的

然后根据samples$run来获取对应的数据集的存储路径,保存于变量files中,并且读入 transcripts-genes对应关系的table

files <- file.path(dir,"salmon", samples$run, "quant.sf")
names(files) <- samples$run
tx2gene <- read.csv(file.path(dir, "tx2gene.csv"))

导入定量数据

txi <- tximport(files, type="salmon", tx2gene=tx2gene)

最后,根据定量数据txi和样本信息samples构建DESeqDataSet

library("DESeq2")
ddsTxi <- DESeqDataSetFromTximport(txi,
                                   colData = samples,
                                   design = ~ condition)

Count matrix input 目录

简单来说就是构建一个表达谱矩阵,然后用DESeqDataSetFromMatrix函数构造DESeqDataSet

详细内容请点 这里

参考资料:

(1) Bioconductor tutorial: Analyzing RNA-seq data with DESeq2