桑福德伯翰医学研究所(Sanford Burnham Prebys Medical Discovery Institute,SBP)承担了前所未有的对一个新兴算法类别的比较分析,该算法通过聚焦内部基因结构,在癌症数据库中挖掘遗传信息(即亚基因像素算法),这与专注于基因视其为单个单元的经典方法形成对照。这些强大的数据筛选工具正在帮助人们解决癌症的复杂性,并且发现以前未知的基因突变,这些突变对癌细胞生成起到重要作用。
这项研究发表在《自然-方法》(Nature Methods)杂志上,该研究对各种独立研究小组开发的20多种算法的优缺点进行了评论、归类和描述。
“尽管高分辨率基因组序列的日益普及,一个通常的假设是把一个基因作为一个单元来考虑,”SBP生物信息学和结构生物学项目主任和该研究的资深作者Adam Godzik博士解释说,“然而,有一些事件,如单一位置DNA替换和剪接变异,可以在亚基因水平发生在一个基因上。亚基因算法提供了一种高分辨率的视图,来解释为什么在同一基因上的不同突变可以导致不同的表型,这取决于基因突变如何影响特定的蛋白质区域。” “关于不同的亚基因突变对癌症有怎样的影响,NOTCH1 基因是个很好的例子,”Godzik说。“NOTCH1在某些区域的基因突变会造成它充当肺部,皮肤和头颈部肿瘤的肿瘤抑制器。但是,NOTCH1在另一个不同区域的突变,则会促进慢性淋巴细胞白血病和T细胞急性淋巴细胞白血病。
因此,无论其位置如何,都假设一个基因突变会产生同样的后果,是不正确的。” 研究人员将每种亚基因算法应用于“癌症基因组图集”(The Cancer Genome Atlas,TCGA)这样的大规模数据集合,其中基因组数据包括来自超过11000个患者的33个不同类型的肿瘤。 “我们的目标不是要判定一种算法比另一种更好,因为这将取决于提出的问题,”Eduard Porta Pardo博士说,他以前是Godzik 实验室的博士后,现在是巴塞罗那超级计算机中心的一名科学家以及该论文的第一作者。“相反地,我们想告诉潜在用户,每个亚基因算法背后的不同假设是如何影响计算结果的,以及,全基因水平的工作方法会给计算结果带来怎样的差异。”
“我们发现了两件重要的事情,”Porta Pardo说。“首先,我们发现,该算法能够再现已知的癌症研究人员已经确定的癌基因列表------验证亚基因方法以及这些基因与癌症之间的联系。第二,我们发现了许多新的癌症驱动基因——这些基因与肿瘤形成过程有关——而这些基因是全基因方法所忽略的。” “发现新的癌症驱动基因是癌症基因组分析的一个重要目标,”Porta Pardo说。“这项研究将帮助研究人员理解亚基因算法的优势和缺陷,并应用该算法来寻找治疗癌症的新的潜在的药物靶点。”
- 2018/03/27
- 2018/03/27
- 2018/03/16
- 2018/03/16
- 2018/03/09
- 2018/03/05
- 2018/03/01
- 2017/02/06