课程大纲
一、课程目标
让学生掌握基因组突变分析的理论基础,熟练运用 R 语言及 Bioconductor 相关包(如 maftools、Sigminer 等)进行突变数据处理、分析与可视化,重点掌握突变特征分析的原理与方法。
二、课程安排
本课程共 4 学时,分为理论讲授(2学时)和上机实验(2学时)两部分。
第一学时:基因组突变基础理论
主题:基因组突变概论
内容:
基因组突变定义:介绍基因组突变基本概念,包括突变类型(如 SNP、插入/缺失等),举例说明不同类型突变引发的后果,如引发疾病、改变性状等。
突变来源:阐述突变产生的原因,如复制错误、环境因素(辐射、化学物质)等,详细解释各个因素导致突变的机制。
突变检测方法:概述常见检测技术,如 Sanger 测序、NGS(下一代测序)等原理及特点,对比不同方法的优劣。
第二学时:Bioconductor 与突变分析工具
主题:Bioconductor 及突变分析相关 R 包介绍
内容:
Bioconductor 简介:简述 Bioconductor 平台,重点介绍其在生物信息学领域,尤其是基因组学分析中的重要地位。
数据格式介绍:详细介绍 VCF 和 MAF 格式的结构、字段含义及用途。
maftools 包:介绍 maftools 包的功能和应用场景,包括突变频谱分析、基因突变分布可视化等。
Sigminer 包:讲解其在突变特征分析中的应用,如提取和分析突变特征,揭示突变的潜在致病机制。
第三学时:突变数据处理与分析实践
主题:突变数据导入与预处理
内容:
数据格式理解:讲解 MAF 格式的各字段含义,如肿瘤样本 ID、基因名、突变类型等。
数据导入:演示如何使用 R 语言读取 MAF 文件,介绍
read.maf()函数及其参数设置。数据清洗与预处理:指导学生对导入的数据进行清洗,如去除缺失值、重复值等。
基础可视化:使用 maftools 包绘制突变概览图、oncoplot 等。
第四学时:突变特征分析实践
主题:突变特征分析
内容:
突变特征概念:介绍突变特征的定义、分类(SBS、DBS、ID、CN等)及生物学意义。
Sigminer 使用:演示如何使用 Sigminer 包进行突变特征提取。
de novo 分析:指导学生进行从头突变特征提取。
特征拟合:介绍如何将提取的特征与已知特征进行比对拟合。
结果解读:帮助学生理解突变特征的潜在生物学意义。
三、课程重点与难点
重点内容
- 突变类型的识别与分类
- MAF/VCF 数据格式的理解与使用
- maftools 包的核心功能与操作
- 突变特征分析的原理与方法
- Sigminer 包的使用流程
难点内容
- 突变特征提取的数学原理(NMF分解)
- 突变特征的生物学解读
- 不同分析策略(de novo vs refitting)的选择
四、教学方式
| 教学环节 | 方式 | 时间分配 |
|---|---|---|
| 理论讲授 | 幻灯片演示 + 讲解 | 2学时 |
| 上机实验 | 演示 + 学生实践 | 2学时 |
| 互动讨论 | 问题解答 + 讨论 | 融入各环节 |
五、考核方式
本课程采用实践作业考核方式,具体要求如下:
| 作业内容 | 分值比例 |
|---|---|
| Oncoplot 绘制 | 30% |
| 基因生存分析 | 40% |
| 结果解读与报告 | 30% |
六、参考教材
- maftools 官方文档:https://bioconductor.org/packages/maftools
- Sigminer 文档:https://shixiangwang.github.io/sigminer-book/
- COSMIC 突变特征数据库:https://cancer.sanger.ac.uk/signatures/
- Bioconductor 官方网站:https://www.bioconductor.org/
七、预备知识
学习本课程前,学生应具备以下基础知识:
- R 语言基本编程能力
- 基础生物统计学知识
- 分子生物学基础概念
- 基因组学基本知识
八、课程资源
详细学习资源请参阅 学习资源 页面。