单核苷酸多态性 单核苷酸多态性分析
随着基因组测序的进展,越来越多的发现基因组中存在大量的SNPs。SNP是最常见的可遗传变异之一,SNP约占人类DNA多态性的90%。SNP是指基因组中特定核苷酸位置存在两个不同的碱基,其中至少一个碱基在群体中的出现频率不低于1%。SNP分为两种形式,一种是基因编码区的SNP,称为cSNP;第二,整个基因组都有大量的单碱基变异。SNP作为一种碱基替代,多为转化,即一种嘌呤变为另一种嘌呤或一种嘧啶变为另一种嘧啶,转化与颠换的比例为2∶1。研究发现,SNP在人类基因组的CpG序列中出现频率最高,约占所有SNP的25%,且多为C→T,这是因为CpG中的胞嘧啶残基被甲基化,可以自发脱氨基产生胸腺嘧啶。因此,SNP与RFL P、STR等DNA标记的主要区别在于,它不再使用“长度”的差异作为检测手段,而是直接使用序列的差异作为标记。但是单个SNP基因座的多态性很差,只有两种状态,因此使用多个SNP基因座进行单倍型分析就显得尤为重要。与第一代和第二代遗传标记相比,该位点采集SNP分析具有以下特点:SNP数量多,分布密集,平均每1000bp有一个SNP。许多SNP可能存在于PKD基因内或附近,可用于ADPKD的单倍型诊断SNP扩增比STR扩增更可靠,不会产生假带;由于SNP是双态的,便于自动批量检测,并通过计算机分析结果。
单核苷酸多态性研究受到广泛重视。它已经成为实验室和公司竞争的对象,也是人类基因组计划的重要补充和研究热点。理论上,用于RFLP和短串联重复序列的技术方法可以用于单核苷酸多态性的识别和检测。然而,印迹分析和聚合酶链反应方法,如SSCP和DGGE,大多需要标记和电泳,耗时费力,难以自动化。近年来,微阵列DNA芯片、飞行质谱、变性高效液相色谱等非电泳分型技术的采用,大大加快了SNP的检测效率。
SNP检测已经广泛应用于很多领域,如疾病的连锁分析和关联分析、肿瘤杂合性丢失、疾病的遗传机制、个性化医学研究等。虽然没有人怀疑SNP在寻找疾病基因中的价值,但事实比人们想象的要困难得多。首先,基因中的重组破坏了SNP和增加疾病风险的变异之间的联系,这使得相关性分析变得困难。有研究指出,关联分析比典型的家族分析需要更多的样本,从而筛选出错误的信号。因此,只有一种高速分析数千个DNA样本的新技术的出现,才会让SNP分析真正有价值;其次,虽然关联分析对于仅在一个基因位点识别缺陷等位基因具有实际意义,但这种情况并不常见。约90%的疾病易感基因有1 0个以上的相关突变,而癌症等疾病往往涉及多个基因。此外,最常见的SNP也是最古老的,它们可以同时存在于正常人或患者中,这意味着SNP与基因关键突变之间的特定联系可能没有特殊的模式,人们很容易错过一个重要的联系或做出错误的联系。样本量也是SNP应用的一个障碍。虽然大多数SNP出现在不同的人群中,但有些SNP可能只出现在一个亚组中,而一些有意义的cSNP也以非常高的比例出现在某个亚组中。因此,要搜索SNP,就需要使用尽可能多的大样本。专利问题也限制了SNP技术的应用。由于SNP的新颖性、实用性和模糊性,很多商业公司在先获得SNP后就可以申请专利,限制了很多研究者对SNP的使用。
文章评论