跳转到主要内容

观点的文章

前面。麝猫。2023年1月13
秒。常见和罕见疾病的基因
https://doi.org/10.3389/fgene.2023.1015017

系统错误的注释截断,功能丧失和同义变体

  • 实验医学,隆德大学,瑞典隆德

遗传和变异现象的描述要求准确的语言和概念。大量的变异数据产生下一代测序管道。获得的变化自动注释,例如,功能的后果。这些工具和管道、系统命名法,主要是工作得很好,但是仍有一些命名中存在的问题,组织一些数据库、滥用的概念和特定的实践。因此,系统误差防止经常正确的注释和排除某些变异类型的进一步分析。问题和解决方案描述为蛋白质截断,变异的自称是基于变异的类型,功能丧失和同义变体不是同义词,导致蛋白质序列的变化或失踪。

1介绍

命名和定义的概念和科学交流的基础。共同语言是基础;然而,很难获得没有歧义。人们经常使用的问题,有时甚至是错误的名字很多在遗传学的概念。困惑似乎也当人们意味着不同的概念相同的术语。读者不能总是从上下文,可以解释意义误解了消息。

许多类型的科学以来分类学已经开发出来Systema Naturae分类介绍了物种的Carl von Linne在1735和1768之间。基因命名中存在的问题和实践前面描述(Vihinen, 2015;Vihinen, 2022)。讨论了系统误差在某些类型的注释,问题的原因和补救措施建议。

下一代测序(上天)数据生成和分析管道生产数量不断增加的变化信息。当这些管道高度电脑化,工具,程序做出正确的选择和使用是基于准确的定义、概念和想法。这些步骤的任何错误和错误影响下游分析和很大程度上没有被发现。一旦获得变异调用,变异注释用于描述的类型的变化数据。变体的注释一步很大程度上决定了结果解释,因为变异选择基于注释的解释。受欢迎的注释工具、术语数据库和实践领域产生系统误差。因此,某些变异不适当的特征,例如,因为他们被归类为无关紧要的或低重要性和相关性疾病。命名、注释工具和数据库主要做伟大的工作,这里的重点是仍然需要注意的问题。这里描述的概念讨论和系统定义在变异本体(不一样的),这有助于描述的变异类型,功能,效果和机制(Vihinen 2014)。

这些问题是有害的科学探究,变化的详细和正确的描述,和变异解释为不同的目的。自然,也影响个体的基因诊断与这样的变异,这可能会导致延误或丢失诊断、虐待和其他问题,在极端情况下的死亡病人即使治疗将是可用的。

2变异注释

变异注释的目的是将功能信息分配给DNA变异。最基本和最常见的注释描述变量变化的编码序列和基因产物的影响。变化是一个关键步骤的注释在变异数据的产生和使用注释是必不可少的,例如,在疾病相关变异分析。如果诱发变异,因为他们很可能忽略的变化的解释。只有计算方法适合全基因组序列的注释。每个人单倍体基因组包含了一些3.5到430万个单核苷酸变异(SNVs)和许多其他类型的变体,与参考序列(相比Auton et al ., 2015)。

数万变异注释方法已经开发出来,可以分组基于理论和实证方法(Samuels et al ., 2022)。最广泛使用的工具包括ANNOVAR (王et al ., 2010),运用变异影响预测(VEP) (麦克拉伦et al ., 2016)和SnpEff (Cingolani et al ., 2012)。注释一个重要的一步是映射参考序列的变异。这取决于使用工具和序列,注释可能显著不同(麦卡锡et al ., 2014)。最近比较ANNOVAR SnpEff表明约85%的一致性当使用相同的参考序列(公园和公园,2021年)。因此,变异注释包含许多分歧和错误,细节依赖于实现和使用工具。注意,注释是一个一般术语添加新信息数据。因此,如人类基因组变异的社会(HGVS发布)描述(窝Dunnen Antonarakis, 2001)变异也是一种形式的注释。

3蛋白质截断

Proteoforms蛋白质形式来自单一基因(史密斯和凯莱赫,2013年)超过10个不同的机制(Vihinen, 2021)。自然选择形式出现在一些蛋白质由于N -或c端截断。这些过程是相当常见的由于可变翻译起始和终止和其他流程(Sharma et al ., 2016;Kaushal和李,2021年)。蛋白水解乳沟是常见的转录后修饰和参与激活和严格监管的活动的蛋白质胰岛素和蛋白酶。Proteoforms源自DNA, RNA和蛋白质水平变化。多肽链的蛋白质截断意味着缩短。系统的定义是“缩短蛋白质序列从终点站”(不一样的:0015)。术语的混乱可能会因为一些科学家认为失踪的蛋白质作为截断。

过早终止密码子(ptc)出现由于几种类型的变化和致病变种中相当普遍。一些文本书籍,几篇文章和字典ptc通常描述为“一个密码子,被转换为相同的序列为终止密码子突变问题由一个貌似没有任何意义的。它不同于一个终止密码子发生异常,导致过早终止蛋白质翻译导致截断蛋白质的生产,这可能是功能性”(https://www.xmri.com/resource-center/conditions.html?term=92806)。这种定义是有问题的,因为在许多情况下没有蛋白产生。

HGVS发布命名(窝Dunnen Antonarakis, 2001基于命名法)和工具生成注释(哈特et al ., 2015;弗里曼et al ., 2018;杂音et al ., 2021)描述PTC-introducing变异蛋白质序列终止信号。这些注释解释为蛋白质截断。然而,大多数的这些变异不是蛋白质截断,因为许多PTC-containing mRNA转录退化,从而没有蛋白质,产生完整的长度或截断,。一个不存在的蛋白质不能被截断!信使rna质量控制机制,主要是non-sense-mediated衰变(NMD),识别PTC-containing成绩单和降低(Kurosaki et al ., 2019)。基因变异的结果取决于除了变异的类型也在其上下文。

NMD机器识别和降低PTC-containing mRNA转录除非成绩单无法逃脱退化。NMD逃脱发生在一定的外显子。这样的一个场景是在倒数第二个外显子在过去50个核苷酸,称为50元规则(伊和Maquat, 1998年)。另一个规则是最后一个外显子,变异不会导致退化(记录Le Hir et al ., 2001)。最近,额外的规则建议。从一开始就停止密码子在150核苷酸密码子可能不会导致退化(Lindeboom et al ., 2016)。根据长外显子规则,外显子超过400个基点降低NMD的效率(Lindeboom et al ., 2016;Hoek et al ., 2019)。许多其他因素影响NMD效率和NMD逃脱,包括最后一个外显子大小、转录的重启,拼接现场救援等。见(卡明斯et al ., 2020;Karczewski et al ., 2020)。

大约10000个匹配分析肿瘤外扩展规则集表示,51%的ptc触发有效NMD (Lindeboom et al ., 2019)。额外的27%的PTC变异预测有中间NMD的效果。因此,总共有78%的可能的ptc导致至少部分NMD,这可能造成严重的影响。这意味着22%的ptc的确可以翻译,导致蛋白质截断。总之,只有一个的四个或五个蛋白质编码的理论截断multi-exon成绩单可能正确的注释。

成绩单的退化NMD意味着编码的蛋白质就不会产生。这是一场淘汰赛,叫类型变体缺少蛋白质在不一样的(不一样的:0240)(Vihinen 2014)。这些改变是最常见的在许多遗传病致病变种。缺少蛋白质组件扭曲复杂的化学计量学和可能导致显性负表型(Veitia Birchler, 2010)。当complex-forming蛋白质丰度不同,复杂的装配功能受损,导致的后果。

失踪的RNA(不一样的:0245)和失踪的蛋白质可以几种类型的变化的结果:替换、插入、删除和indels (Vihinen, 2021 b)。异常导致外显子剪接跳过或与顺向阅读框包含变更PTC-introducing变体(见很常见图1)。异常splicing-causing变体可以出现外显子和内含子。

图1
www.雷竞技rebatfrontiersin.org

图1。例子过早停止codon-introducing变异的结果,原始序列左边和右边的变体。分类学与HGVS发布和不同的注释用于观察或变异的预测结果。(一)替换的DMD基因引入了PTC(列车自动控制系统),因此成绩单退化,没有蛋白质的产生。HGVS发布注释表明虚对RNA和蛋白质含量的影响。因此,这样的变异是蛋白质截断,尽管没有蛋白质的产生。不一样的失踪的失踪RNA和蛋白质的注释描述实际变化。变化问题RNA水平,注释貌似没有任何意义可以添加到显示是什么原因丢失的RNA。(B)Indel在BTK在RNA基因引入了帧频失调的indel PTC(列车自动控制系统)。没有蛋白质产生由于NMD。正确的HGVS发布注释在这两个例子是RNA水平r。0或r p(0)和蛋白质水平。0或p。(0)。与VariantValidator HGVS发布注释生产,遵循HGVS发布注释规则。差异在原始和变体链在红色和强调。RNA和蛋白质变化在支架理论结构,分子在现实中不存在。

问题的注释源自命名,命名工具、注释和数据库。HGVS发布命名法促进变化的系统的描述(窝Dunnen Antonarakis, 2001)。它被广泛使用,它使计算搜索和分析可能的,然而,它也仍然引起一些问题。注释的例子从HGVS发布命名建议PTC对蛋白质含量的影响突显出问题(图1一个):“LRG_199p1: p。Trp24Ter (p.Trp24 *)氨基酸Trp24改为一个终止密码子(Ter, *)。注意:这个变化不是描述为删除的c端一端蛋白质(即p . Trp24_Met36853del)”(HGVS发布网站http://varnomen.hgvs.org/recommendations/protein/variant/substitution/访问2 2023年1月)。

同种型肌营养不良蛋白的长3685氨基酸,由79个外显子。这个变异氨基酸24远未结束的蛋白质,因此最后外显子或50元规则不适用。外显子也不到400个基点。网站是接近外显子一个起始密码子和start-proximal规则可能因此适用。这就意味着还有另一个功能翻译起始位点,这实际上已经在某些肌营养不良蛋白变体(Gurvich et al ., 2009)。如果翻译开始从外显子6,氨基酸的密码子24不是翻译后的区域,不能导致终止密码子。总之,没有终止位置24没有蛋白表达被终止。HGVS发布笔记表明它不像大型c端删除注释,然而,这是人们如何解释注释。这种蛋白质是不产生由于NMD,或者它可能是表示从替代翻译开始网站;无论哪种方式,给定的蛋白质注释是不正确的。正确的注释在NMD的情况下是不一样的:0240缺少蛋白质当使用不同的术语和p。(0)在HGVS发布注释,在括号中表示预测,或者还有一个成绩单和氨基端短蛋白不含氨基酸。

相应的RNA变化根据HGVS发布注释LRG_199t1: r.72g >。在LOVD模式数据库https://databases.lovd.nl/shared/genes/DMDRNA注释是r。(?)。成绩单不生产,因此,注释在RNA应该r。0或r。(0),或者基于使用的替代转录起始位点是不包含这个网站的新记录。对应不同的RNA注释是不一样的:0245失踪的RNA,或者在新记录。可以声称有一个RNA替换之前的RNA是退化的,然而,最后的结果是没有文字记录。DMD数据库中的一个确定RNA注释r。(?)。给一个蛋白质注释p。(Arg24Ter)。

图1 b描述PTC-related变异的一个例子。Indel c。592年_595delinsctaactacataBTK布鲁顿酪氨酸激酶基因(Lougaris et al ., 2020)是根据HGVS发布注释命名为p。Lys199Thrfs * 3的蛋白质水平。19外显子之间的变异出现在外显子8。编码区插入,删除和indels在坐标系或帧频失调的,广泛讨论的RNA变体看到(Vihinen, 2021 b)。为变异有机会被翻译介绍了序列变化应该被三整除保留编码区,防止过早停止。变量不能被3整除(理论上三分之二的情况下)改变编码帧,通常引入一个PTC变异后不久的网站。在这个例子中,介绍了PTC中间的成绩单和NMD探测到。因此,RNA和蛋白质注释提供基于HGVS发布命名法是不正确的。正确的注释是r。(0)(0)和p。变异的PTC-related问题命名法命名分布进一步计算工具的变化,包括Mutalyzer (杂音et al ., 2021)、变体验证器(弗里曼et al ., 2018)和hgvs发布包(哈特et al ., 2015)。这些方法遵循HGVS发布命名法。因此,这些问题的出现也在变异数据库中,如维护LOVD (Fokkema et al ., 2021)。变异注释方法,如ANNOVAR SnpEff,电话等变异停止获得(ed),但不要描述变异的结果。

如果变异导致丢失蛋白质(p.0)注解为截断,注释的用户可能会获得一个错误的想法,例如对剩余活动。其他问题出现,当一个人想要了解原因,机制和影响这些变量,在考虑策略来治疗病人。在一些神经退行性疾病真正的截短蛋白mis-localized并导致疾病表型特征Jadhav et al ., 2013),而缺少蛋白质由于缺少活动是有害的。NMD激活已被视为治疗,例如,对肌萎缩性脊髓侧索硬化症(ALS)降解PTC-containing成绩单和防止有害蛋白质的生产形式(Jaffrey威尔金森,2018)。了解蛋白质是否截断或失踪可以有基本的临床意义。因此,准确的注释这种变异是至关重要的。

4功能丧失为变异类型

功能有些变化可以称为功能丧失的后果(lof)或功能(gof),许多变化没有任何功能影响正常遗传异质性(Vihinen, 2022 b)。额外的形式的功能效应是antimorphic(敌对)和neomorphic(新活动)变异,看到(Vihinen, 2021)。

Lof或潜在/预测Lof (plof)已被广泛用作变异类型,例如,在https://macarthurlab.org/lof/,尽管这是一个功能的效果。这种做法可能简化术语,但它也产生混乱和错误。这样的预测可能是有用的指导和优化实验研究,然而,准确lof和gof语句应该基于实验证据(Vihinen, 2021),因为没有一个明确的相关性变化类型和功能效果。

Plof变量被定义为那些“过早停止(stop-gained) shift-reported转录框架(转移),或改变这两个重要的剪切位点核苷酸立即每个外显子的左派和右派(拼接)中发现的蛋白质编码记录”(Karczewski et al ., 2020)。确实许多这样的变异导致lof,但不是全部。即使有一个lof效应,可能不会引起表型。大量的氨基酸替换也lof效果,但是他们没有被包含在(p) lof类别。

Plof注释(卡明斯et al ., 2020;Karczewski et al ., 2020)在一个广泛的生产预测管道,其中包括许多规则,分析和推理来解决不同类型的变化和不同的影响。众多之前的系统允许修正错误和代plofs的目录,这是非常广泛用于各种目的,包括临床变异的解释。的资源是有价值的确定可能的lof变异,然而,用户应该记住,所提供的注释是预测和所有变异是不准确的。即使正确plof注释表明有lof效应,它并不自动意味着变异生物效应,将描述临床或其他后果的变体。

正如上面所讨论的,超过20%的PTC变异逃脱NMD,因此可能不是lof类型,例如因为有一些剩余的活动。同样,其他类型的变体在任何情况下没有点的影响。一些拼接中断,特别是造成外显子跳过没有RNA转移,可以用一些剩余活动编码蛋白质,生物功能(这可能是足够的Oda et al ., 2016;中村et al ., 2017)。外显子跳过或intronic包含可以在mRNA在坐标系和代码为蛋白质和有一些剩余的活动。这些变异在图片的改变通常有一个早期的PTC和被NMD和退化。

细胞、组织和生物体有许多机制,调节,减少各种扰动的影响,包括基因变化。这些机制,减少影响的变化被称为TARAR对策后宽容、回避、修理、衰减和电阻(Vihinen, 2021;Vihinen, 2022 c)。这些机制和流程是内置的,内在的,而另一些则活跃和有扰动时安装。这些机制返回系统足够和相关程度称为lagom (Vihinen, 2020)。所谓的lof变异,宽容、修复、衰减甚至抵抗相关。人体是健壮的和可以忍受各种扰动,疾病宽容就是一个例子McCarville Ayres, 2018)。修复对策,包括DNA修复,是高度相关的表型和遗传变异的校正和救援(Vihinen, 2022 b)。多余的活动是一种形式的衰减。抗性对策积极反对变异的影响,DNA损伤反应(Ciccia和埃里奇那本怀特,2010)是DNA水平抗性的一个例子。

阅读框可以纠正的错误回复突变的镶嵌性,恢复部分或完全的野生型表型或活动通过降级回原始序列(赫塞豪恩,2003)。除了实际的回复突变体和其他变体网站内activity-restoring变异,变异在其他网站可能弥补变更,几个这样的变异被认为在一个病人(t细胞戴维斯et al ., 2010)。

Biallelic淘汰赛的许多人类基因没有表型。几项研究已经显示不同数量的这种基因,在1285年和3230年之间(麦克阿瑟et al ., 2012;Sulem et al ., 2015;列克et al ., 2016;纳史木汗et al ., 2016;Saleheen et al ., 2017)。人类半合淘汰赛变异的估计数量接近100,完成淘汰赛变体在健康个体约20 (麦克阿瑟et al ., 2012)。淘汰赛的这些基因可以被容忍,因为不需要的基因,至少在正常的生活条件,或可能存在冗余活动在ohnologs对策降低效应,等。

人类基因组,以及与其他真核生物一样,是一个两个完整的基因组复制的结果(Dehal Boore, 2005),产生了无数ohnologs,间接同源的基因。仍有7358人类ohnolog双(辛格和Isambert, 2020),因此大量的潜在的多余的活动,这可能会相互补充的行为,防止或减少变异的影响在某些细胞或情况。单基因疾病基因是富含重复和复制疾病相关基因有更高的相似性关闭paralogous基因比其他基因(陈et al ., 2013)。冗余可能掩盖了大量的变异影响函数在一个假字。兼职活动和衬底和催化滥交的蛋白质进一步增加的复杂性和减少变异的影响(Vihinen, 2021)。不完全外显率是另一个混杂因素。

在描述lof效果,有必要指函数和系统和注释与水平。一个变体可以有不同的lof取决于水平的影响。不一样的(Vihinen 2014)促进DNA的描述(Vihinen 2018)、RNA (Vihinen, 2021 b)和蛋白质(Vihinen, 2015 b)变异,后果,机制和功能的影响。有几个函数在每一个层面上。DNA的功能包括催化活性、信息传递、DNA修复、DNA复制、监管、水库的遗传物质和转录。功能在RNA水平影响氨基酸转让、催化活性、监管、信息传递、拼接功能和翻译。在蛋白质水平有七个功能:催化、信息传输、运动、识别、存储、结构蛋白,和运输活动。功能从而影响应该被描述在所有相关的水平和影响函数(s)表示,而不只是声称(p) lof变体。以防有几个成绩单或proteoforms,功能描述应该为每个人提供了分别。

讨论进一步复杂功能影响是,功能和生物学效应可能有所不同。生物系统是健壮的,甚至可以容忍实质性的改变。几个酶病,enzyme-related疾病,显示一个表型只有当有大量亏损活动相比正常活动(Vihinen, 2021)。例如,在不同形式的血友病,90%或更多的正常活动已经丢失了一个病人显示严重的表型(Peyvandi et al ., 2012;斯利瓦斯塔瓦et al ., 2013)。因此,变体注解为分类(p) lof实际上有一个大大减少函数可能不引起疾病。也有例子更小活动损失是疾病或phenotype-causing (Vihinen, 2021)。在haploinsufficiency,失去一个等位基因,即50%的活动,导致疾病的biallelic表达式(Morrill亚,2019年)。所以有必要了解活动水平的相关性损失,延长讨论见(Vihinen, 2021)。功能讨论,生物功能阈值应该被定义,但是这些数据丢失对大多数蛋白质,即使对于酶,是最简单的定义的阈值。因此,分类功能注释不能适用于所有的变异和基因/蛋白质。

lof注释问题主要源自注释工具和数据库。例如,ANNOVAR (王et al ., 2010)、VEP (麦克拉伦et al ., 2016)和功能丧失成绩单效应估计量(LOFTEEhttps://github.com/konradjk/loftee)装配变体lof一类基于类型的变化。广泛使用的数据库外显子组聚合联盟(ExAC)数据库(Karczewski et al ., 2017)和基因聚合数据库(gnomAD) (Karczewski et al ., 2020)是建立在plof原则。变异类型并不是一个简单的代理功能的影响。这些工具的模型太简单的考虑过程,机制、途径和系统,影响生物体的功能效应(Vihinen, 2021)。

类似于lof变体,有问题也在使用期内gof。它可以指的是不同类型的影响,并不一定清楚从上下文和生物的影响还不清楚。此外,增加活动的生物相关性往往是未知的。许多gof和lof没有生物的后果和影响属于正常的生物学异质性。

5同义变体

RNA替换通常是错误的,分为三个类别:错义,想法和同义看起来相当不可理喻。注意,这些条款只对信使rna序列相关,而不是DNA或蛋白质变异,看到(Vihinen, 2015)。使用三类完全忽略了第四类变异可能从表面上看是同义词,但事实上影响蛋白质序列,通常导致丢失蛋白质由于PTC-containing mRNA转录(NMD退化Vihinen, 2022)。

当替换只从基因编码的角度看,许多有害的变异并被错误地归类为同义词。即使同义变体,它可以影响DNA, RNA或蛋白质和非同义效果(Vihinen, 2022)。在DNA,这样的变异可以改变转录因子结合位点。即使编码蛋白序列是不变的,蛋白质的活动,由于同义结构或调控可能改变信使rna变化(桑拿和Kimchi-Sarfaty, 2011;Shabalina et al ., 2013)。

几个明显的差异实际上非同义。促进注释的变体,他们最近更名为unsense变异(Vihinen, 2022)。为什么他们不是同义词,尽管编码帧看起来完好无损,是他们影响信使rna剪接或剪接调控或削弱监管microrna的绑定,从而影响蛋白质丰富,常常因为NMD导致缺少蛋白质。如果只看密码子表,这些变种像同义。其实拼接网站(Wehr et al ., 2018),ESS, ESE (Tonin et al ., 2019)变异可以影响剪接,导致各种影响和改变顺序,经常引入PTC(列车自动控制系统)。编码地区microrna的结合位点变异也会影响监管或基因表达甚至防止蛋白的生产(泰et al ., 2008)。这些变体都系统地忽视了当前实践,从而提供错误的注释。

Unsense被描述为不同的变化:0514”替换信使rna编码区,影响基因表达,蛋白质或蛋白质生产没有终止密码子的突变引入网站”。因为unsense变异目前没有注释,他们很大程度上忽略了在临床变异解释和被认为是无关紧要的或低的重要性。在现实中,这些变体有实质性的影响,与多种疾病有关。原因,这些错误分类缺乏认识,在分类学失踪术语,注释中的错误。因此,重要的是要记住,明显的变异可能非同义,有各种各样的影响。变异应该被称为同义只基于实验证据或可靠的预测(这不是当前可用)。

6把它对吧

三个因素有助于纠正挑战和其他人不在这里讨论。首先,遗传学家和其他用户的遗传数据必须意识到这些问题。第二,分类学等术语变化必须被更新。第三,计算机程序,数据库和其他信息资源必须得到改善。

教育和提高意识是在纠正错误的关键因素。充分理解变化的影响是一个要求很高的任务,除了遗传,从业者必须理解蛋白质,其功能、交互、结构、网络等。目前,遗传学领域占主导地位,这也可能部分解释上述问题。许多功能变异的影响体现在蛋白质水平,这可能不是熟悉的遗传学家的领域。

遗传学社会应该提供教育材料来训练新建立的科学家使用适当的术语包括上面的问题了。教科书应该被更新以包含的最新发展变化类型和影响,也在他们的命名和注释。此外,科学会议可以覆盖上面列出的问题和其他提高意识和教育社区正确和准确的实践。

许多系统的分类与变异和变异的描述。变异注释与HGVS发布命名为所有可能的变化提供条件和结果。相关术语介绍(失踪),用户培训正确使用术语和努力发展中确切的命名约定各种变体。这已经基本到位,但仍然有问题引入和发展。实践和管道的预测功能的影响必须得到改善,同时警告可能被添加到通知用户可能的错误和问题。意识是一个关键因素。此外,其他系统误差与变异相关数据已更新,只要相关。例如,不同的本更新以保持一致。

即使完美的系统误差的存在,它不是宝贵的如果不习惯。变异注释和分析主要是基于计算工具。因此,注释工具,程序变量命名,和数据库分布生成的数据需要更新他们的例程和特别注意目前被忽略,忽略和错误类型的变化。

变异解释为基因诊断在许多国家是基于美国大学医学遗传学和基因组学和分子病理学协会(ACMG / AMP)指导方针和标准(理查兹et al ., 2015)。这些指导方针在系统化的变异解释和提供更可靠的解释。指南也有一些问题,例如,(金正日et al ., 2019;Vihinen, 2020 b)。这里我将讨论上述问题应如何考虑在变异解释根据ACMG / AMP的指导方针。

计算和预测数据,良性支持BP7:沉默的变体non-predicted拼接的影响。这一类涉及到许多unsense变体。人们应该注意的外显子/内含子边界的变化也在外显子,因为他们可能不会沉默。

PM4、蛋白质长度改变变异目前认为适度支持致病性评估。尽可能多的蛋白质截断误分类,重要的是要小心这样的变异。缺少蛋白质,而不是为致病性截断通常是一个强有力的证据。

PS3,建立功能研究显示有害影响。功能的研究必须考虑到生物系统,自TARAR对策减少有害的影响甚至一些实质性变化的变体。它不是足够的如研究蛋白质的活动在体外

BP6和PP5是著名的信息来源,在其他数据库(s)。这些可以参考如ExAC, gnomAD和LOVD数据库。重要的是要考虑这些资源和潜在的质量问题,他们通过案件和不同变异类型。

PVS1准则,详细的决策树已经阐述了不同类型的lofs (阿布Tayoun et al ., 2018)。它考虑了变异类型,可能NMD,拼接效果和其他因素。评估的结果差别很大从pv证据还有注释不能的情况。

它是永远也不可能自动注释所有变体正确因为许多因素导致的表型变异。因此,实验研究将永远是必要的。应该支持可靠的预测和注释,可以强调潜在的案件进行进一步的调查。

数据可用性声明

最初的贡献提出了研究中都包含在本文/辅料,可以针对相应的作者进一步询问。

作者的贡献

作者证实了这项工作的唯一贡献者和已批准出版。

资金

这项研究是由Vetenskapsradet(2019 - 01403)和瑞典癌症协会(1350)。

的利益冲突

作者说,这项研究是在没有进行任何商业或金融关系可能被视为一个潜在的利益冲突。

出版商的注意

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。

引用

阿布Tayoun, a . N。Pesaran, T。DiStefano, m . T。Oza,。雷姆曾为此写过,h·L。、Biesecker l G。,et al。(2018)。建议解释的损失函数PVS1 ACMG标准/ AMP变体。嗡嗡声。Mutat。39岁,1517 - 1524。doi: 10.1002 / humu.23626

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Auton,。布鲁克斯,l D。德宾,r . M。驻军,e . P。康,h . M。戈倍尔,j . O。,et al。(2015)。一个全球参考人类遗传变异。自然526年,68 - 74。doi: 10.1038 / nature15393

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

陈,w . H。赵,x M。范Noort, V。博克,p (2013)。人类单基因疾病基因经常功能冗余假字。公共科学图书馆第一版。医学杂志。9,e1003073。doi: 10.1371 / journal.pcbi.1003073

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Ciccia,。和埃里奇那本怀特,s . j . (2010)。DNA损伤反应:使它安全玩刀。摩尔。细胞40岁,179 - 204。doi: 10.1016 / j.molcel.2010.09.019

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Cingolani, P。普氏,。王,L。L., Coon, M., Nguyen, T., Wang, L., et al. (2012). A program for annotating and predicting the effects of single nucleotide polymorphisms, SnpEff: SNPs in the genome of黑腹果蝇应变w1118;iso-2;iso-3。飞。(奥斯丁)6,80 - 92。doi: 10.4161 / fly.19695

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

卡明斯,B, B。Karczewski, k . J。Kosmicki, j。Seaby, e . G。瓦,n。Singer-Berk, M。,et al。(2020)。成绩单expression-aware注释提高稀有变异的解释。自然581年,452 - 458。doi: 10.1038 / s41586 - 020 - 2329 - 2

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

戴维斯b R。燕,Q。Bui, j . H。Felix, K。Moratto D。、Muul l . M。,et al。(2010)。体细胞的镶嵌性wiskott-aldrich综合症:分子和基因型回复突变体的功能特性。中国。Immunol。135年,72 - 83。doi: 10.1016 / j.clim.2009.12.011

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Dehal, P。Boore, j·l . (2005)。两轮的全基因组重复祖先的脊椎动物。公共科学图书馆杂志。3,e314。doi: 10.1371 / journal.pbio.0030314

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

窝Dunnen, j . T。,Antonarakis s e (2001)。术语描述人类的序列变化。嗡嗡声。麝猫。109年,121 - 124。doi: 10.1007 / s004390100505

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Fokkema,我。克朗,M。埃尔南德斯,l . j . A。Asscheman D。Lugtenburg,我。Hoogenboom, J。,et al。(2021)。LOVD3平台:高效的全基因组遗传变异的共享。欧元。j .的嗡嗡声。麝猫。29日,1796 - 1803。doi: 10.1038 / s41431 - 021 - 00959 - x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

弗里曼,p . J。哈特,r·K。作用,l . J。布鲁克斯,a·J。,Dalgleish r (2018)。VariantValidator:准确的验证、映射和格式的序列变异的描述。嗡嗡声。Mutat。39岁,61 - 68。doi: 10.1002 / humu.23348

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Gurvich, o . L。,Maiti B。维斯,r . B。Aggarwal, G。,霍华德·m·T。Flanigan, k . m . (2009)。DMD外显子1删除点突变:改进的表型选择翻译起始外显子6。嗡嗡声。Mutat。633 - 640年。doi: 10.1002 / humu.20913

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

哈特,r·K。Rico, R。兔子,E。加西亚,J。韦斯特布鲁克,J。,Fusaro诉a (2015)。一个Python包解析、验证映射和格式使用HGVS发布命名序列变异。生物信息学31日,268 - 270。doi: 10.1093 /生物信息学/ btu630

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

赫塞豪恩,r (2003)。在活的有机体内在人类回归正常的遗传突变。j .地中海,麝猫。40岁,721 - 728。doi: 10.1136 / jmg.40.10.721

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

隐谷,t。Khuperkar D。Lindeboom, r . g . H。、Sonneveld年代。Verhagen, b . m . P。、Boersma年代。,et al。(2019)。单分子成像揭示规则nonsense-mediated mRNA衰变。摩尔。细胞75年,324 - 339。doi: 10.1016 / j.molcel.2019.05.008

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Jadhav, S。Zilka, N。诺瓦克,m (2013)。蛋白质人类神经退行性foldopathies截断的公分母。摩尔。一般人。48岁,516 - 532。doi: 10.1007 / s12035 - 013 - 8440 - 8

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

观点,s R。威尔金森,m . f . (2018)。Nonsense-mediated RNA衰变的大脑:新兴调制器的神经发育和疾病。Nat,启>。19日,715 - 728。doi: 10.1038 / s41583 - 018 - 0079 - z

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Karczewski, k . J。、Francioli l . C。挑,G。卡明斯,B, B。Alfoldi, J。王,Q。,et al。(2020)。从141年的变异突变约束谱量化,456人。自然581年,434 - 443。doi: 10.1038 / s41586 - 020 - 2308 - 7

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Karczewski, k . J。,Weisburd B。,托马斯B。Solomonson, M。Ruderfer, d . M。Kavanagh D。,et al。(2017)。ExAC浏览器:显示参考数据信息从60岁以上000外显。核酸Res。45,D840-D845。doi: 10.1093 / nar / gkw971

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Kaushal, P。李,c (2021)。N-terminomics——它的过去和最近的进展。j .蛋白质组学233年,104089年。doi: 10.1016 / j.jprot.2020.104089

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

金,y E。Ki, c . S。张成泽,m . a . (2019)。挑战和考虑孟德尔疾病的序列变异的解释。安。实验室。地中海。39岁,421 - 429。doi: 10.3343 / alm.2019.39.5.421

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Kurosaki, T。Popp来说,m . W。,Maquat l . e . (2019)。质量和数量的基因表达控制nonsense-mediated mRNA衰变。Nat。启摩尔。细胞杂志。20岁,406 - 420。doi: 10.1038 / s41580 - 019 - 0126 - 2

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Le Hir H。Gatfield D。Izaurralde E。,m·j·摩尔(2001)。exon-exon结复杂因素提供了一个绑定平台参与mRNA出口和nonsense-mediated mRNA衰变。Embo J。20岁,4987 - 4997。doi: 10.1093 / emboj / 20.17.4987

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

产生杂音,M。Vis, j·K。Vermaat, M。窝Dunnen, j . T。,Taschner, p . e . M。Laros, j·f·j . (2021)。下一代HGVS发布命名法检查。生物信息学37岁,2811 - 2817。doi: 10.1093 /生物信息学/ btab051

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

列克,M。Karczewski, k . J。Minikel, e . V。Samocha, k . E。、银行、E。,芬内尔,T。,et al。(2016)。分析蛋白质编码基因变异的706人。自然536年,285 - 291。doi: 10.1038 / nature19057

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Lindeboom, r G。Supek F。雷纳,b (2016)。nonsense-mediated mRNA衰变的规则和影响在人类癌症。Nat,麝猫。48岁,1112 - 1118。doi: 10.1038 / ng.3664

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Lindeboom, r . g . H。Vermeulen, M。雷纳,B。,Supek f (2019)。nonsense-mediated mRNA衰变的影响遗传疾病,基因编辑和癌症免疫疗法。Nat,麝猫。51岁,1645 - 1651。doi: 10.1038 / s41588 - 019 - 0517 - 5

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Lougaris, V。Soresina,。奥,M。Montin D。马蒂诺,S。、标记。,et al。(2020)。长期随访的168例x连锁agammaglobulinemia显示发病率和死亡率增加。j .过敏中国。Immunol。146年,429 - 437。doi: 10.1016 / j.jaci.2020.03.001

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

麦克阿瑟,d·G。Balasubramanian年代。法兰克,。黄,N。莫里斯,J。沃尔特,K。,et al。(2012)。系统的调查功能丧失人类蛋白质编码基因变异。科学335年,823 - 828。doi: 10.1126 / science.1215040

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

麦卡锡,d J。汉保格,P。Kanapin,。Rivas, m。Gaulton, K。Cazier, j·B。,et al。(2014)。选择的记录和软件对变异注释有很大影响。基因组医学。6,26岁。doi: 10.1186 / gm543

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

McCarville, j·L。Ayres, j . s . (2018)。疾病公差:概念和机制。咕咕叫。当今。Immunol。50岁,88 - 93。doi: 10.1016 / j.coi.2017.12.003

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

麦克拉伦、W。吉尔,L。亨特,s E。Riat, h·S。里奇,g R。Thormann,。,et al。(2016)。运用变异效果预测。基因组医学杂志。17日,122年。doi: 10.1186 / s13059 - 016 - 0974 - 4

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Morrill, s。亚,a (2019)。为什么haploinsufficiency依然存在。Proc。国家的。学会科学。美国的一个。116年,11866 - 11871。doi: 10.1073 / pnas.1900437116

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Nagy, E。,Maquat l . e . (1998)。规则在intron-containing基因终止密码子的位置:当废话影响RNA丰富。学生物化学的发展趋势。科学。23日,198 - 199。doi: 10.1016 / s0968 - 0004 (98) 01208 - 0

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

中村,。日本柴,N。宫崎骏,D。Nishizawa, H。稻叶型,Y。Fueki, N。,et al。(2017)。比较患者的表型窝藏在坐标系删除开始在杜氏肌萎缩症基因外显子45表明外显子不治疗的发展潜力。j .的嗡嗡声。麝猫。62年,459 - 463。doi: 10.1038 / jhg.2016.152

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

纳史木汗,v . M。亨特,k。梅森,D。贝克,c . L。Karczewski, k . J。巴恩斯,m R。,et al。(2016)。卫生和人口的影响相关的罕见的基因在成年人淘汰赛的父母。科学352年,474 - 477。doi: 10.1126 / science.aac8624

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

特战分队,H。佐藤,T。、Kunishima年代。中川,K。Izawa, K。Hiejima E。,et al。(2016)。外显子不引起非典型表型与功能丧失相关的突变FLNA通过恢复其蛋白质功能。欧元。j .的嗡嗡声。麝猫。24岁,408 - 414。doi: 10.1038 / ejhg.2015.119

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

公园,k . J。公园,j . h (2021)。命名法的临床变异注释工具之间的差异。实验室。地中海。53岁,242 - 245。doi: 10.1093 / labmed / lmab074

CrossRef全文|谷歌学术搜索

Peyvandi F。迪米凯莱的D。,Bolton-Maggs, p . H。李,c。Tripodi,。斯利瓦斯塔瓦,。,et al。(2012)。罕见的出血失调(rbd)的分类根据凝血因子活性和临床出血严重程度之间的关系。j . Thromb。Haemost。10日,1938 - 1943。doi: 10.1111 / j.1538-7836.2012.04844.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

理查兹,S。阿齐兹,N。贝尔,S。比克,D。Das, S。Gastier-Foster, J。,et al。(2015)。标准和指导方针的序列变异的解释:联合一致推荐的美国大学医学遗传学和基因组学和分子病理学协会。麝猫。地中海。17日,405 - 424。doi: 10.1038 / gim.2015.30

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Saleheen D。Natarajan, P。Armean, i M。赵,W。拉希德,。Khetarpal, s。,et al。(2017)。一群人类淘汰赛和表型分析高速率的血缘关系。自然544年,235 - 239。doi: 10.1038 / nature22034

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

塞缪尔,d . C。Yu, H。郭,y (2022)。是时候重新评估变异注释吗?趋势麝猫。38岁,521 - 523。doi: 10.1016 / j.tig.2022.02.002

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

桑拿、z . E。,Kimchi-Sarfaty c (2011)。理解疾病同义突变对人类的贡献。Nat,启麝猫。12日,683 - 691。doi: 10.1038 / nrg3051

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Shabalina, s。,Spiridonov: A。Kashina, a (2013)。沉默的声音:同义核苷酸作为关键生物调控和复杂性。核酸Res。41岁,2073 - 2094。doi: 10.1093 / nar / gks1205

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

沙玛,S。托莱多,O。海顿,M。里昂,k . F。布鲁克斯,s . B。、大卫·r·P。,et al。(2016)。人类C-terminome功能。《公共科学图书馆•综合》11日,e0152731。doi: 10.1371 / journal.pone.0152731

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

辛格,P P。,Isambert h (2020)。OHNOLOGS v2:综合资源保留在脊椎动物基因组复制的基因。核酸Res。48岁的D724-D730。doi: 10.1093 / nar / gkz909

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

史密斯,l . M。凯莱赫,n . l . (2013)。Proteoform:一个词描述蛋白质的复杂性。Nat方法。10日,186 - 187。doi: 10.1038 / nmeth.2369

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

斯利瓦斯塔瓦,一个。布鲁尔,a K。、Mauser-Bunschoten e P。关键:S。、厨房、S。Llinas,。,et al。(2013)。血友病的管理指南。血友病19日,e1-e47。doi: 10.1111 / j.1365-2516.2012.02909.x

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Sulem, P。,Helgason H。Oddson,。Stefansson, H。Gudjonsson, s。辛克,F。,et al。(2015)。识别大量罕见的完整的人类淘汰赛。Nat,麝猫。47岁,448 - 452。doi: 10.1038 / ng.3243

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

茶,Y。张,J。汤姆森,a . M。Lim, B。,Rigoutsos i (2008)。小分子核糖核酸,Nanog Oct4和Sox2编码区域调节胚胎干细胞分化。自然455年,1124 - 1128。doi: 10.1038 / nature07299

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Tonin, R。、Catarzi年代。Caciotti,。普•罗科皮,E。马里尼,C。Guerrini, R。,et al。(2019)。进行性肌阵挛癫痫在戈谢病由于新Gly-Gly其实拼接增强剂的突变造成损失。j .神经。266年,92 - 101。doi: 10.1007 / s00415 - 018 - 9084 - 4

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Veitia, r。Birchler, j . a (2010)。优势在健康和疾病和基因剂量平衡:为什么水平很重要。j .分册。220年,174 - 185。doi: 10.1002 / path.2623

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2021)。功能蛋白质变异的影响。Biochimie180年,104 - 120。doi: 10.1016 / j.biochi.2020.10.009

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2022)。个人遗传异质性。基因(巴塞尔)13日,1626年。doi: 10.3390 / genes13091626

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2015)。混乱遗传小姐和混乱的信息。趋势麝猫。31日,423 - 425。doi: 10.1016 / j.tig.2015.05.008

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2022)。通用模型生物的监管。F1000Res。11日,419年。doi: 10.12688 / f1000research.110944.1

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2020)。Poikilosis——无处不在的生物变异。F1000Res。9日,602年。doi: 10.12688 / f1000research.24173.2

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2020)。变异的解释问题在实施准则和计算工具。摩尔,麝猫。基因组医学。8,e1206。doi: 10.1002 / mgg3.1206

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2018)。系统误差的类型和DNA变异的影响。BMC基因组学19日,974年。doi: 10.1186 / s12864 - 018 - 5262 - 0

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2021)。系统误差的类型和RNA变化的影响。RNA杂志。18日,481 - 498。doi: 10.1080 / 15476286.2020.1817266

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2015)。类型和影响蛋白质的变化。嗡嗡声。麝猫。134年,405 - 421。doi: 10.1007 / s00439 - 015 - 1529 - 6

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2014)。变异注释的本体变化的影响和机制。基因组Res。24岁,356 - 364。doi: 10.1101 / gr.157495.113

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Vihinen, m (2022)。当一个同义变体产生的。基因(巴塞尔)13日,1485年。doi: 10.3390 / genes13081485

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

王,K。李,M。,Hakonarson h (2010)。ANNOVAR:从高通量测序数据变异基因的功能注释。核酸Res。38岁的e164。doi: 10.1093 / nar / gkq603

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

Wehr C。格劳秀斯,K。、Casadei年代。Bleckmann D。预示,美国f . N。弗莱,b . C。,et al。(2018)。小说在GATA2致病其实同义突变影响RNA拼接。132年,1211 - 1215。doi: 10.1182 / - 2018 - 03 - 837336血

《公共医学图书馆摘要》|CrossRef全文|谷歌学术搜索

关键词:变异注释错误,蛋白质截断,丧失变异,变异,同义突变,移码的变化

引用:Vihinen M(2023)系统误差在截断的注释,功能丧失和同义变体。前面。麝猫。14:1015017。doi: 10.3389 / fgene.2023.1015017

收到:09年8月2022;接受:2023年1月3日;
发表:2023年1月13日。

编辑:

劳拉诉送奶工人北卡罗莱纳大学教堂山分校,美国

审核:

埃莉诺恩Seaby英国南安普顿大学
罗迪沃尔什荷兰、学术医疗中心

版权©2023 Vihinen。这是一个开放分布式根据文章知识共享归属许可(CC)。使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。

*通信:Mauno Vihinen,mauno.vihinen@med.lu.se

下载