转录组测序原理与实验流程
2026-03-21
RNA-seq(RNA sequencing) 是利用高通量测序技术对转录组进行定量和定性分析的方法
| 特性 | RNA-seq | 芯片(Microarray) |
|---|---|---|
| 检测范围 | 全转录组(已知+未知) | 预设探针(已知基因) |
| 灵敏度 | 高,可检测低表达基因 | 中等,受背景噪音影响 |
| 动态范围 | 宽(>10^4) | 窄(~10^2) |
| 发现能力 | 新转录本、融合基因 | 限于已知序列 |
| 成本 | 逐渐降低 | 相对较低 |
结论:RNA-seq已成为转录组研究的标准方法
样本采集 → RNA提取 → mRNA富集 → 片段化 → cDNA合成
↓
结果分析 ← 数据处理 ← 测序 ← 文库制备 ← 接头连接
关键质控点: - RNA完整性(RIN > 7) - 文库浓度和片段大小 - 测序质量(Q30 > 85%)
| 指标 | 要求 | 说明 |
|---|---|---|
| RIN值 | > 7 | RNA完整性,Bioanalyzer检测 |
| 浓度 | >100 ng/μL | NanoDrop或Qubit检测 |
| 纯度 | A260/A280 = 1.8-2.1 | 蛋白污染检测 |
警告
注意:RNA易降解,提取后应立即进行后续步骤或-80°C保存
适用:真核生物、完整RNA样本
优点: - 富集成熟mRNA - 数据利用率高 - rRNA污染低
缺点: - 丢失非编码RNA - 无poly-A的转录本丢失 - 不适合降解样本
适用:原核生物、降解样本
优点: - 保留非编码RNA - 更全面的转录组 - 适合FFPE样本
缺点: - rRNA残留可能较高 - 数据复杂度增加
| 模式 | read长度 | 应用场景 | 成本 |
|---|---|---|---|
| SE50 | 50 bp单端 | 基因表达定量 | 低 |
| SE75 | 75 bp单端 | 常规表达分析 | 中 |
| PE100 | 100 bp双端 | 剪接分析、新转录本 | 高 |
| PE150 | 150 bp双端 | 复杂转录组、融合基因 | 最高 |
推荐:一般表达分析用PE100-150
| 分析类型 | reads/样本 | 说明 |
|---|---|---|
| 基因表达定量 | 10-30 M | 标准差异分析 |
| 差异剪接 | 50-100 M | 需要更高覆盖度 |
| 融合基因检测 | >100 M | 低丰度事件检测 |
| 单细胞测序 | 50K-500K/细胞 | 依细胞类型而定 |
原则:生物学重复 > 测序深度
重要
关键:实验设计决定分析的上限,设计缺陷无法通过分析弥补
对照组 (n=3) vs 处理组 (n=3)
↓ ↓
提取RNA 提取RNA
↓ ↓
建库测序 建库测序
↓ ↓
←—— 差异分析 ——→
同一患者:治疗前 (n=20) vs 治疗后 (n=20)
↓
配对分析:控制个体差异,提高统计效能
批次效应(Batch Effect):由非生物学因素引起的系统性差异
| 来源 | 影响程度 | 示例 |
|---|---|---|
| 操作者 | 高 | 不同人员操作习惯差异 |
| 时间 | 高 | 不同日期提取RNA |
| 试剂批次 | 中 | 不同批次试剂性能差异 |
| 仪器 | 中 | 不同测序仪、flow cell |
❌ 错误:样本按批次聚类,而非生物学分组
✅ 正确:样本按生物学条件聚类
✅ 推荐:块设计(Block Design)
Day 1: 对照1-3 + 处理1-3
Day 2: 对照4-6 + 处理4-6
❌ 避免:
Day 1: 所有对照组
Day 2: 所有处理组
| 方法 | R包 | 适用场景 |
|---|---|---|
| ComBat | sva | 已知批次变量 |
| ComBat-seq | sva | RNA-seq计数数据 |
| 纳入设计公式 | DESeq2 | 批次作为协变量 |
Q = -10 × log10(P) (P为错误概率)
| Q值 | 准确率 | 错误率 | 评价 |
|---|---|---|---|
| 30 | 99.9% | 0.1% | 优秀 |
| 20 | 99% | 1% | 可接受 |
| <20 | <99% | >1% | 差 |
要求:Q30 > 85%
| 指标 | 可接受 | 良好 | 优秀 |
|---|---|---|---|
| 总比对率 | >70% | >85% | >90% |
| 唯一比对率 | >60% | >75% | >85% |
| rRNA比例 | <10% | <5% | <2% |
警告
低比对率可能原因: - 接头未去除干净 - 样本污染 - 参考基因组选择错误
📧 wangshx@csu.edu.cn 🌐 https://wanglabcsu.github.io/ 🐙 https://github.com/WangLabCSU

RNA-seq概述 | 中南大学