跳转到主要内容gydF4y2Ba

原始研究的文章gydF4y2Ba

前面。化学。,10 January 2023
秒。理论和计算化学gydF4y2Ba
卷10 - 2022 |gydF4y2Ba https://doi.org/10.3389/fchem.2022.1087963gydF4y2Ba

生成一个泛素链的构象景观原子论的决议由back-mapping抽样为基础gydF4y2Ba

www.雷竞技rebatfrontiersin.orggydF4y2Ba西蒙HunklergydF4y2Ba 1gydF4y2Ba,gydF4y2Bawww.雷竞技rebatfrontiersin.orggydF4y2Ba特蕾莎修女BuhlgydF4y2Ba1gydF4y2Ba,gydF4y2Bawww.雷竞技rebatfrontiersin.orggydF4y2BaOleksandra KukharenkogydF4y2Ba 2gydF4y2Ba和gydF4y2Bawww.雷竞技rebatfrontiersin.orggydF4y2Ba克里斯汀•彼得gydF4y2Ba 1gydF4y2Ba*gydF4y2Ba
  • 1gydF4y2Ba康斯坦茨大学化学系,康斯坦茨,德国gydF4y2Ba
  • 2gydF4y2Ba马克斯·普朗克聚合物研究所、美因茨、德国gydF4y2Ba

泛素链是灵活的多畴的蛋白质,在细胞信号具有重要的生物功能。与所有原子分子动力学模拟计算研究的构象空间polyubiquitins可以挑战由于系统规模和众多的长寿meta-stable状态。粗粒化是一种有效的方法来克服这个出现流失的成本高分辨率细节。最近,我们提出了基于back-mapping抽样(bmb)方法,把原子论的信息到一个给定的粗粒度(CG)采样基于一个二维(2 d)投影的构象,产生原子论的合奏,并允许系统地比较两个级别的分辨率的集合体。这里,我们应用bmb K48-linked tri-ubiquitin,显示其适用性较大的系统比原来的介绍,表明该算法与系统大小尺度很好。在扩展原始bmb我们测试三种不同的播种策略,即不同的方法从CG景观原子论的轨迹中。此外,我们最近推出了构象聚类算法应用于back-mapped原子论的合奏。因此,我们获得的洞察力的结构组成二维景观和说明降维算法分离不同的构象特征很好地到不同的地区的地图。这个聚类分析可以让我们展示原子论的轨迹示例构象,通过投影空间和总之收敛到一个原子论的构象景观略不同于原始CG地图,指示修正缺陷的CG模板。gydF4y2Ba

1介绍gydF4y2Ba

如今分子动力学(MD)模拟是一个良好的工具研究蛋白质和蛋白质复合物在原子论的决议。然而它仍然可以计算非常昂贵获得较大的蛋白质系统收敛MD轨迹几千个原子组成。一个典型的方法克服这些限制是使用粗粒化。这里,自由度的数量显著减少了将多个原子组合成一个“超级”或“珠”。gydF4y2Ba

我们使用粗粒度(CG) MD模拟来研究泛素链(乌兰巴托)的蛋白质。乌兰巴托是由76个氨基酸,在细胞信号传导起着重要的作用。在这一过程被称为“ubiquitylation”isopeptide债券之间形成一个组底物蛋白质和赖氨酸的c端羧基乌兰巴托分子。从第一个乌兰巴托分子可以附加其他乌兰巴托根形成poly-ubiquitin链(Ub-chains)各种长度。第一个附加泛素提供了八个潜在linkage-sites:氨基蛋氨酸(M1)和七个赖氨酸残基(转K6、K11 K27, K29, K33, K48, K63)。根据相关linkage-sites,链的长度和拓扑,Ub-chains信号的基质蛋白不同的功能,例如,DNA损伤耐受或蛋白酶体降解。(gydF4y2BaPickart eddin, 2004gydF4y2Ba;gydF4y2BaKomander和强奸,2012年gydF4y2Ba)。gydF4y2Ba

理解和解释差异的生理行为polyubiquitin链需要工具来描述他们的构象空间之一。这是一个具有挑战性的任务由于Ub-conjugates及其构象多样性的动态行为。gydF4y2BaThach et al。(2016)gydF4y2BaCG MD模拟结合降维和集群技术可用于获得的统计系综的详细描述配置由Ub-chains填充。最近gydF4y2BaBerg et al。(2020)gydF4y2Ba使用修改后的马提尼v2.2 (gydF4y2BaMarrink et al ., 2007gydF4y2Ba;gydF4y2BaMonticelli et al ., 2008gydF4y2Ba;gydF4y2Ba德容et al ., 2013gydF4y2Ba)CG力场和机器学习来描述和比较相关的di - tri-Ub构象空间gydF4y2Ba通过gydF4y2Ba所有八个linkage-sites以及免费注射。粗粒化大大加速了相空间的探索,但可能会导致不准确。评估的结果CG抽样tri-Ub我们进行广泛的原子论的模拟(总共4µs仿真时间)K48-linked tri-Ub-chains从一个扩展的构象。我们比较CG和原子论的模拟的相空间预测所有数据相同的二维空间(见gydF4y2Ba图1 a, BgydF4y2Ba,详细给出了投影法在第二节)。gydF4y2Ba

图1gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图1gydF4y2Ba。2 d的预测K48-linked tri-Ub轨迹从粗粒度(gydF4y2BaBerg et al。(2020)gydF4y2Ba)gydF4y2Ba(一)gydF4y2Ba和两个独立的原子论的模拟gydF4y2Ba(B)gydF4y2Ba。gydF4y2Ba(B)gydF4y2Ba原子论的模拟是彩色基于自由能值,CG地图是灰色的,一样的gydF4y2Ba(一)gydF4y2Ba;从原子论的三个模范构象模拟及其位置的地图。红球连着第一残渣,表明近端单元,和一个绿色的球连着最后残留,说明远端一半。gydF4y2Ba(一部)gydF4y2Ba2 d地图的彩色几何中心(齿轮)之间的距离的两个三乌兰巴托半个CG模拟。gydF4y2Ba

已经乍一看,比较显示,而原子论的蛋白质快速进化扩展开始的构象与Ub-domains之间的接触更紧凑的结构,大部分地区的CG构象空间不是采样期间4µs原子论的模拟。gydF4y2Ba

40的强力原子论的模拟只有两个采样地图的中间区域,对应于一个完全倒塌的构象(见gydF4y2Ba图1 bgydF4y2Ba)。为了得到一个更好的理解的意思不同地区的地图,尤其是访问CG模型而不是原子论的一个,我们的重心的投影模拟基于成对的几何中心之间的距离(齿轮)的三个乌兰巴托根(gydF4y2Ba图1汉英gydF4y2Ba)。构象景观大致可以分为三个部分,由一个“T”式的形状更频繁采样领域:第一和第二的右上角部分代表构象乌兰巴托半个密切接触;左下端包含构象与第二和第三根之间的密切接触者;最后有一个梯度的第一和第三个一半之间的距离从左上角到右下角的手手。gydF4y2Ba

现在的问题是否出现的原子论的模拟不访问CG构象空间的实质性部分的结果长度不足产生的原子论的模拟或非物质的构象CG模型。一个方法,非常适合解决这个问题是基于back-mapping抽样(bmb) (gydF4y2BaHunkler et al ., 2019gydF4y2Ba)。我们介绍了这一技术通过分析一个相当大幅度的寡肽模型变粗了。bmb允许的应用引入原子论的研究和动态信息系统以及CG抽样来纠正错误。背后的核心理念方法如下:在二维导航自由能景观非常有效地生产的CG乐团,选定的构象可以back-mapped更高(如原子论的)分辨率开始新的短探险的原子论的模拟为了样品的所有访问相空间尽可能快。收敛/散度的初始CG和获得BMBS-guided原子论的风景是定量监测使用选定的指标(挖土机的距离(EMD) (gydF4y2Ba阿普尔盖特et al ., 2011gydF4y2Ba))。给出了在2.2节和详细信息(gydF4y2BaHunkler et al ., 2019gydF4y2Ba)。gydF4y2Ba

下面我们展示bmb算法可以用来解决这个问题是否CG和原子论的景观之间的差异源于原子论的抽样不足或CG模型中的主要缺陷。此外,我们在这里展示,bmb适用于更大的系统相比,它的引入。我们扩展最初引入bmb计划与分析的初始权重/偏差的影响back-mapped配置用于启动单纯bmb模拟。我们还执行的详细分析原子论的合奏获得与bmb应用新引入聚类方案gydF4y2BaHunkler et al。(2022)gydF4y2Ba。gydF4y2Ba

2方法/计算细节gydF4y2Ba

2.1仿真的细节gydF4y2Ba

所有的原子论的模拟进行了使用2016.4或2020.4版本的GROMACS包(gydF4y2BaBekker et al ., 1993gydF4y2Ba)修改GROMOS 54 a7力场(gydF4y2Ba施密德et al ., 2011gydF4y2Ba水)和SPC / E模型。改变了力场isopeptide债券的引入,能够模拟乌兰巴托半个共价相连。而且使用以下设置:时间步长设置为2 fs,温度设置为300 K使用速度重新调节恒温器和压力设置为1条Parrinello-Rahman恒压器。作为一个积分器算法,使用跨跃算法。远程交互与粒子网格计算埃瓦尔德方法,在傅里叶栅格间距16 nm和pme-order 4。库仑和范德华相互作用,使用截止1.4海里。为了限制所有债券,距离算法应用。gydF4y2Ba

为CG模拟使用修改后的马提尼力场(基于马提尼v2.2) (gydF4y2BaMarrink et al ., 2007gydF4y2Ba;gydF4y2Ba德容et al ., 2013gydF4y2Ba)protein-water互动增加,避免过于粘蛋白。马提尼极化CG水作为溶剂。温度设置为300 K使用速度重新调节恒温器,压力保持在1酒吧的Parrinello-Rahman恒压器。Verlet截止方案应用,距离算法利用债券约束和跨跃integrator使用。10 fs时间步是由于软弹性网络潜力(IDEN) (gydF4y2BaGlobisch et al ., 2013gydF4y2Ba)。截止距离短程范德华相互作用被设置为1.1 nm,静电学和治疗反应场方法截止距离为1.1 nm和15的介电常数。为更多的细节在马提尼力场是如何修改的gydF4y2BaBerg et al。(2018)gydF4y2Ba。gydF4y2Ba

2.2基于Back-mapping抽样gydF4y2Ba

基于back-mapping抽样(bmb)算法(gydF4y2BaHunkler et al ., 2019gydF4y2Ba)被用来有效地引入原子论的决议,CG模拟和总结不久。bmb使用一个低维投影的CG表面自由能启动新的原子论的模拟,包括以下步骤:1)CG模拟预计将一个二维景观;2)很多选中的CG结构back-mapped全面解决原子论的水平;3)新短原子论的模拟运行从选中结构迅速探索相空间;4)收敛或发散监控通过比较CG和在低维空间中原子的概率分布。这些步骤依赖于五个主要部分:集体变量(CVs)适用于高维CG和原子论的配置,一个降维的方案,一个方法来从CG系综选择开始配置(播种),back-mapping战略和统计指标监控收敛。他们如下所述。gydF4y2Ba

2.2.1集体变量:Residue-wise最小距离gydF4y2Ba

原则上可以使用许多不同的CVs /特性集结合bmb工作流。具体选择的简历几乎完全依赖于给定的系统。关于简历唯一的要求是它必须能够描述这个系统在两个决议(原子论的和CG模型)。因此,必须依靠出现在两个模型的坐标。我们使用来描述和分析的CVs tri-Ub系统是residue-wise最小距离(限制型心肌病)。它已被证明在这之前限制型心肌病非常适合描述domain-domain配置泛素链因为它们敏感蛋白质的距离和相对方位的接口和域(gydF4y2BaBerg et al ., 2018gydF4y2Ba;gydF4y2Ba伯格和彼得,2019年gydF4y2Ba;gydF4y2BaBerg et al ., 2020gydF4y2Ba)。一个构象tri-Ub这样的简历是一个432维的向量,其中包含的每个72 C的最小距离gydF4y2BaαgydF4y2Ba原子(泛素的高度灵活的残留73 - 76不考虑)的每个乌兰巴托域任何CgydF4y2BaαgydF4y2Ba原子的另一根。这组内部坐标描述距离以及个人泛素的相对取向对彼此和半个可以应用于原子论的以及CG系统(如果骨干珠出席任何CgydF4y2BaαgydF4y2Ba位置)。gydF4y2Ba

为了描述tri-Ub的限制型心肌病向量,远端,中产和近端根被缩写为A、B和c,这个符号“近端”指的是一部分免费的糖链可以与底物和“远”表示终端一半的糖基结合Ub-unit中间。这三个域名可以制定gydF4y2Ba一个gydF4y2Ba= (gydF4y2Ba一个gydF4y2Ba1gydF4y2Ba,gydF4y2Ba一个gydF4y2Ba2gydF4y2Ba,gydF4y2Ba一个gydF4y2Ba3gydF4y2Ba、…gydF4y2Ba一个gydF4y2BangydF4y2Ba),gydF4y2BaBgydF4y2Ba= (gydF4y2BabgydF4y2Ba1gydF4y2Ba,gydF4y2BabgydF4y2Ba2gydF4y2Ba,gydF4y2BabgydF4y2Ba3gydF4y2Ba、…gydF4y2BabgydF4y2Ba米gydF4y2Ba),gydF4y2BaCgydF4y2Ba= (gydF4y2BacgydF4y2Ba1gydF4y2Ba,gydF4y2BacgydF4y2Ba2gydF4y2Ba,gydF4y2BacgydF4y2Ba3gydF4y2Ba、…gydF4y2BacgydF4y2BaogydF4y2Ba),gydF4y2Ba一个gydF4y2Ba我gydF4y2Ba,gydF4y2BabgydF4y2BajgydF4y2Ba和gydF4y2BacgydF4y2BakgydF4y2Ba的位置是C吗gydF4y2BaαgydF4y2Ba分别或骨干珠子。然后两两距离矩阵gydF4y2BaDgydF4y2Ba一个gydF4y2Ba,gydF4y2BaBgydF4y2Ba,gydF4y2BaDgydF4y2BaBgydF4y2Ba,gydF4y2BaCgydF4y2Ba和gydF4y2BaDgydF4y2Ba一个gydF4y2Ba,gydF4y2BaCgydF4y2Ba计算。以最小值所在的行和列向量residue-wise最低三根之间的距离(gydF4y2Ba一个gydF4y2BaBgydF4y2Ba,gydF4y2BaBgydF4y2Ba一个gydF4y2Ba,gydF4y2BaBgydF4y2BaCgydF4y2Ba,gydF4y2BaCgydF4y2BaBgydF4y2Ba,gydF4y2Ba一个gydF4y2BaCgydF4y2Ba,gydF4y2BaCgydF4y2Ba一个gydF4y2Ba)计算。这些向量是连接到一个高维表示维度(432)认为tri-Ub构象,限制型心肌病向量。所有CG配置预计将两个维度通过限制型心肌病向量作为输入特征降维方法encodermap (gydF4y2BaLemke et al ., 2019gydF4y2Ba;gydF4y2BaLemke和彼得,2019年gydF4y2Ba)。gydF4y2Ba

2.2.2降维:EncodermapgydF4y2Ba

Encodermap (gydF4y2BaLemke et al ., 2019gydF4y2Ba;gydF4y2BaLemke和彼得,2019年gydF4y2Ba)利用autoencoder架构调整autoencoder损失函数通过添加multidimensional-scaling-like损失项[方程gydF4y2Ba1gydF4y2Ba(Eq。gydF4y2Ba3gydF4y2Ba)]。这些额外损失函数变换乙状结肠所有距离的函数(Eq。gydF4y2Ba4gydF4y2Ba),称为示意图损失由于其连接示意图降维方法gydF4y2BaCeriotti et al。(2011)gydF4y2Ba。示意图损失函数允许encodermap再现高维数据点之间的连接在一个2 d地图,这意味着构象与高维CVs也彼此靠近的二维投影。此外,autoencoder架构允许方法项目在很短的时间内大量的数据。gydF4y2Ba

lgydF4y2Ba encodermapgydF4y2Ba =gydF4y2Ba kgydF4y2Ba 一个gydF4y2Ba lgydF4y2Ba 汽车gydF4y2Ba +gydF4y2Ba kgydF4y2Ba 年代gydF4y2Ba lgydF4y2Ba 草图gydF4y2Ba +gydF4y2Ba RgydF4y2Ba egydF4y2Ba ggydF4y2Ba (gydF4y2Ba 1gydF4y2Ba )gydF4y2Ba
lgydF4y2Ba 汽车gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba NgydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba NgydF4y2Ba DgydF4y2Ba XgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba XgydF4y2Ba ̃gydF4y2Ba 我gydF4y2Ba (gydF4y2Ba 2gydF4y2Ba )gydF4y2Ba
lgydF4y2Ba 草图gydF4y2Ba =gydF4y2Ba 1gydF4y2Ba NgydF4y2Ba ∑gydF4y2Ba 我gydF4y2Ba ≠gydF4y2Ba jgydF4y2Ba NgydF4y2Ba 年代gydF4y2Ba 我gydF4y2Ba GgydF4y2Ba hgydF4y2Ba DgydF4y2Ba XgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba XgydF4y2Ba jgydF4y2Ba −gydF4y2Ba 年代gydF4y2Ba 我gydF4y2Ba GgydF4y2Ba lgydF4y2Ba DgydF4y2Ba xgydF4y2Ba 我gydF4y2Ba ,gydF4y2Ba xgydF4y2Ba jgydF4y2Ba 2gydF4y2Ba (gydF4y2Ba 3gydF4y2Ba )gydF4y2Ba

在这里,gydF4y2BakgydF4y2Ba一个gydF4y2Ba,gydF4y2BakgydF4y2Ba年代gydF4y2Ba可调节的权重,gydF4y2Ba注册gydF4y2Ba是一个正规化,用于防止过度学习;gydF4y2BaNgydF4y2Ba表示数据点的数量预计;gydF4y2BaDgydF4y2Ba(⋅⋅)是一个点之间的距离,gydF4y2BaXgydF4y2Ba是高维输入向量,gydF4y2BaxgydF4y2Ba是低维投影(瓶颈层);gydF4y2Ba团体gydF4y2BahgydF4y2Ba和gydF4y2Ba团体gydF4y2BalgydF4y2Ba情商所示是乙状结肠函数的形式。gydF4y2Ba4gydF4y2Ba,gydF4y2Ba

年代gydF4y2Ba 我gydF4y2Ba GgydF4y2Ba σgydF4y2Ba ,gydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba bgydF4y2Ba DgydF4y2Ba =gydF4y2Ba 1gydF4y2Ba −gydF4y2Ba 1gydF4y2Ba +gydF4y2Ba 2gydF4y2Ba 一个gydF4y2Ba bgydF4y2Ba −gydF4y2Ba 1gydF4y2Ba DgydF4y2Ba σgydF4y2Ba 一个gydF4y2Ba −gydF4y2Ba bgydF4y2Ba 一个gydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 4gydF4y2Ba )gydF4y2Ba

在哪里gydF4y2Ba一个gydF4y2Ba,gydF4y2BabgydF4y2Ba和gydF4y2BaσgydF4y2Ba参数定义距离保护的范围。gydF4y2Ba

一旦网络训练,编码器是一个数学函数,将高维输入映射到低维投影。在这个映射函数位于encodermap算法的主要优势之一,即额外的高维输入数据点的极其有效投影到低维空间。gydF4y2Ba

自从encodermap方法是非线性的,由此产生的二维空间的坐标轴不一定允许物理解释的命令参数。因此我们选择忽略x和gydF4y2BaygydF4y2Ba相互重合的2 d绘图显示在这个手稿。添加这些轴将在我们看来误导读者,而不是帮助理解这些数据。gydF4y2Ba

类似于CVs的选择上,可以选择使用不同的降维方法与bmb工作流。然而,这种方法应该满足一些需求。首先它必须是可能的(最好是快)项目额外的数据点到低维空间。其次的方法应该能够独立的低维空间中不同结构可靠(2 d或3 d如果想可视化投影)。Encodermap在这两个任务执行得非常好和非常有效的预测数据一旦训练。gydF4y2Ba

encodermap的参数用于这项工作了gydF4y2Ba表1gydF4y2Ba。我们使用encodermap 2.0.1版本及其实现gydF4y2Bahttps://github.com/AG-Peter/encodermapgydF4y2Ba。gydF4y2Ba

表1gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

表1gydF4y2Ba。Encodermap参数用于生成二维投影显示在这项工作。gydF4y2Ba

2.2.3播种gydF4y2Ba

获得的二维投影的CG合奏用于种子新短原子论的MD模拟back-mapped CG结构。如果选择适当的初始构象,这需要bmb模拟只有一小部分的仿真时间比一个标准的医学样品等量的可用的相空间。在原始bmb纸gydF4y2BaHunkler et al。(2019)gydF4y2Ba开始配置是基于二维动画景观中的最小值(gydF4y2Ba图2一个gydF4y2Ba)。在本文中,我们想要探索更多细节不同的播种策略和研究对bmb性能的影响。除了最初的播种方法,我们称之为minima-focused,我们测试Boltzmann-weighted和均匀播种(见gydF4y2Ba图2gydF4y2Ba)。gydF4y2Ba

图2gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图2gydF4y2Ba。播种策略摘要:gydF4y2Ba(一)gydF4y2Ba最小值集中(红点),gydF4y2Ba(B)gydF4y2Ba玻耳兹曼加权(蓝色点),gydF4y2Ba(C)gydF4y2Ba制服(绿点)。每个种子由50 back-mapped构象。他们的预测是在原来的CG景观(灰色梯度,一样gydF4y2Ba图1gydF4y2Ba(一)gydF4y2Ba)。gydF4y2Ba

minima-focused播种我们选择的起始结构复制CG最深的自由能最小值的二维分布及其权重以及可能的。为实现这一目标我们应用2 d CG的装箱空间和创建一个列表最密集的垃圾箱。然后我们从最高的随机选择了一个数据点密集的本和重复,直到开始从这个本结构的比例近似匹配的百分比数据点在这个本。这个过程是重申所有最密集的垃圾箱,直到一个预定义的数量开始构象摘要(50)。gydF4y2Ba

Boltzmann-weighted播种在开始选择还包括罕见的构象结构。我们之前被2 d空间但随机挑选一本,接受或拒绝这个本蒙特卡罗标准(本人口概率成正比)。随机数据点的选择接受本作为起始结构和过程重复进行,直到50选择数据点。这样的过程让我们尽可能地包括罕见的构象和留住最初的CG分布给出一个非常有限的样本大小(50分)。理论上与一个更大的样本量这个过程将收敛于一个随机选择的启动配置完整的高维空间配置。gydF4y2Ba

最后我们选择了一个统一的播种(统一的指的是均匀分布在二维空间)。我们再次使用相同的装箱前和随机选择一本。从这个箱子一个数据点是随机选择的,本就删除从池中可用的箱子(删除本就变得很重要,如果选择数据点的数量接近可用垃圾箱的数量)。这是再次重复,直到50选择起始点。gydF4y2Ba

3.1节中不同种子的结果进行比较。gydF4y2Ba

2.2.4 Back-mappinggydF4y2Ba

在back-mapping原始论文的主要部分是由把一个原子的结构与CVs CG结构类似于一个目标。然后一个外部限制潜在应用于原子的结构在一个能量最小化步骤以迫使其构象保留的CVs CG的目标。在这个工作我们使用CG轨迹生成与马提尼模型,因此应用“落后”(gydF4y2BaWassenaar et al ., 2014gydF4y2Ba在选定CG)脚本重新引入一个原子论的分辨率结构。gydF4y2Ba

2.2.5统计指标:挖土机的距离gydF4y2Ba

监控两个构象之间的相似性相空间,例如,CG和原子论的抽样,我们使用挖土机的距离(EMD)(也称为瓦瑟斯坦的度量或锦葵距离)。这个指标描述了相似或不同的两个给定的多元分布。正式定义的方法看到如gydF4y2Ba阿普尔盖特et al . (2011)gydF4y2Ba。为了能够定量地比较EMD值我们使用基于统一的规范化EMD。这个实现EMD将所有值的范围(0,1)(Eq。gydF4y2Ba5gydF4y2Ba)。gydF4y2Ba

EgydF4y2Ba 米gydF4y2Ba DgydF4y2Ba ′gydF4y2Ba =gydF4y2Ba EgydF4y2Ba 米gydF4y2Ba DgydF4y2Ba −gydF4y2Ba 最小值gydF4y2Ba EgydF4y2Ba 米gydF4y2Ba DgydF4y2Ba 马克斯gydF4y2Ba EgydF4y2Ba 米gydF4y2Ba DgydF4y2Ba −gydF4y2Ba 最小值gydF4y2Ba EgydF4y2Ba 米gydF4y2Ba DgydF4y2Ba ,gydF4y2Ba (gydF4y2Ba 5gydF4y2Ba )gydF4y2Ba

分钟(gydF4y2BaEMDgydF4y2Ba)= 0和马克斯(gydF4y2BaEMDgydF4y2Ba)= 1.62。max(系数gydF4y2BaEMDgydF4y2Ba)在此定义为EMD的比较CG 2 d投影与均匀矩形二维分布相同数量的数据点。这种2 d矩形区域的尺寸给出的最小值和最大值gydF4y2BaxgydF4y2Ba和gydF4y2BaygydF4y2Ba重心的投影值。通过实现EMD以这样一种方式,值为0意味着两个给定的分布完全相同,值为1意味着两个分布不同的CG投影而均匀分布数据集。为了计算EMD我们使用python实现gydF4y2BapyemdgydF4y2Bav0.5.1 (gydF4y2Ba贝利,沃曼2009gydF4y2Ba)。gydF4y2Ba

2.3集群方案gydF4y2Ba

分析等复杂系统的原子论的集合体tri-Ub我们使用最近推出了集群方案可有效处理大量的高维数据gydF4y2BaHunkler et al。(2022)gydF4y2Ba。在这个我们使用迭代聚类工作流HDBSCAN (gydF4y2BaCampello et al ., 2015gydF4y2Ba)作为聚类算法并结合两种不同的降维算法,即cc_analysis (gydF4y2BaDiederichs 2017gydF4y2Ba2.2.2)和encodermap(部分)。HDBSCAN是一个分层density-based聚类算法能够找到集群的不同形状和密度只需要少量的输入参数(至少一个)。cc_analysis是multidimensional-scaling-like方法最小化高维数据点的皮尔森相关系数之间的差异和低维向量代表的标量积。gydF4y2Ba

在这个集群工作流cc_analysis投影的概率密度作为聚类空间(中间维度;通常10至40尺寸),2 d encodermap空间是用来有效地处理大型数据集,并将额外的构象分配给已确定集群。提供的数据集集群迭代,直到指定的构象被分配给集群或到指定数量的集群的迭代执行。在分配的过程中构象集群C的均方根偏差(RMSD)截止gydF4y2BaαgydF4y2Ba原子的位置是用来获得构象上非常明确的集群。gydF4y2Ba

应用集群方案我们设置HDBSCAN tri-Ub系统参数“min_cluster_size”和“min_samples”到80年,使用一个RMSD截止3 A的距离。集群方案运行三个迭代。gydF4y2Ba

3结果与讨论gydF4y2Ba

3.1 bmbgydF4y2Ba

我们应用bmb方法K48-linked三聚物的泛素与三个不同的播种算法:最小值集中,玻耳兹曼加权,统一(见2.2.3节详细描述)。在每种情况下我们选择50的起点。每开始结构我们跑一个原子论的MD模拟与累积50 ns模拟时间的2.5µs播种。50个起点的位置所示gydF4y2Ba图2gydF4y2Ba。bmb仿真轨迹是将原来的CG景观和中可以看到gydF4y2Ba图3 a - cgydF4y2Ba。这三个地图显示,起点的选择严重影响产生的构象空间(详细分析获得构象及其传播的二维投影在3.3节讨论)。gydF4y2Ba

图3gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图3gydF4y2Ba。50个原子论的模拟预测用bmb minima-focused获得gydF4y2Ba(一)gydF4y2Ba,Boltzmann-weightedgydF4y2Ba(B)gydF4y2Ba和统一的gydF4y2Ba(C)gydF4y2Ba种植。gydF4y2Ba(D)gydF4y2BaEMD CG和bmb预测之间的值作为采样时间的函数。预测和emd线的颜色对应的着色gydF4y2Ba图2gydF4y2Ba。gydF4y2Ba

bmb与所有三个种子队访问的底部CG 2 d地图也不是由两个初始4采样µs原子论的模拟(比较gydF4y2Ba图1 bgydF4y2Ba)。尤其是均匀播种轨迹保留自由能最小值的“T”形排列的原始分布虽然只有很少的构象开始选择那些地区的地图。这表明,而快速发展的轨迹被播种在车轮中心部分的二维投影。gydF4y2Ba

纯粹的视觉比较获得的地图可能会误导人,因为它是重要的不仅涵盖了CG相空间,正确样品自由能最小值。二维分布等定量的比较我们使用EMD,这完全符合bmb工作流。EMD本大小不敏感(可以申请比较不同的直方图),是对称的,是更敏感的高度密集的地区的相似之处比人口很少的。EMD值比较原始的CG投影的时间演化不同播种bmb预测所示gydF4y2Ba图3 dgydF4y2Ba。与视觉感知,EMD情节表明minima-focused和Boltzmann-weighted种植生产原子论的集合体,其预测像CG目标地图更好(EMD的价值点后50个人的ns的仿真时间运行)比均匀播种的投影轨迹(.179)。另一方面,CG分布均匀播种bmb方法非常快,尤其是在前10 ns的仿真时间。把这些EMD值,初始的投影的比较4µs原子论的模拟.815 CG分布给出了EMD。gydF4y2Ba

因此我们可以回答最初的问题之间的差异的原因CG和原子论的集合体。通过将bmb算法应用到K48-linked tri-ubiquitin,我们获得150原子论的bmb轨迹提供足够的证据来自信地说,CG合奏不包含大量的非物质的构象。给予足够的仿真时间,两个初始原子论的轨迹很可能也体会到了构象,位于较低的部分的2 d地图。gydF4y2Ba

然而这些新的原子论的轨迹的生成是只有bmb算法的一个方面。另一部分是监测和比较二维直方图的发展随着时间的推移。在下一节中提供了这一分析。gydF4y2Ba

3.2 EMD监控gydF4y2Ba

为了分析的时间/时间发展bmb CG地图相比我们提取的2 d bmb轨迹的预测不同的采样时间。我们选择生成一个直方图每250 ps的模拟时间一个很好的时间分辨率。这导致了200年预测每个播种方法。每个直方图计算EMD的CG 2 d地图所示和EMD得到值gydF4y2Ba图3 dgydF4y2Ba和gydF4y2Ba图4gydF4y2Ba。gydF4y2Ba

图4gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图4gydF4y2Ba。时间分辨的emd(红色实线,一样gydF4y2Ba图3 dgydF4y2Ba)和逆转(橙色虚线)的时间表minima-focused bmb直方图的CG地图。gydF4y2Ba

除了时间演化的minima-focused bmb(红色在两个数据行)提供的gydF4y2Ba图3 dgydF4y2Ba,gydF4y2Ba图4gydF4y2Ba显示了相反的时间表minima-focused bmb直方图(橙色线)的CG地图。通过逆转我们意味着每个minima-focused的最后一帧的投影轨迹的起点是直方图生长与原来的时间表,这意味着每个直方图从一个点轨迹可以样品一段时间了,因此很可能在某些元稳定状态。远期时间表(红色线gydF4y2Ba图4gydF4y2Ba)与初始non-monotonic行为减少EMD值(两个直方图更加相似)直到13 ns,其次是增加和停滞不前的值约为13。相同的行为被发现在最初的(gydF4y2BaHunkler et al ., 2019gydF4y2Ba)论文基于外推预测CG模型数据和可以解释为CG样本中缺陷的修正。减少播种偏见的影响在200年时间分辨直方图我们还包括逆转时间轴(橙线gydF4y2Ba图4gydF4y2Ba)。这个时间表显示bmb轨迹搬离了他们最初的种子。随着模拟时间轨迹的方法原来的起点,从而导致减少EMD值。这清楚地表明,bmb轨迹远离最密集地区的CG 2 d地图,表明底层CG构象分布并不完全代表构象合奏对应原子论的哈密顿。gydF4y2Ba

使用emd我们还监测和比较不同播种方法的行为。gydF4y2Ba图5gydF4y2Ba比较了minima-focused(红色曲线)和Boltzmann-weighted(蓝色曲线)种子生成的直方图的最后10 ns模拟从各自的其他播种。用这个比较我们可以确定如果两组样本轨迹收敛于一个共享的一部分相空间或者他们是否随时间发散不同构象空间的地区访问。蓝色的曲线gydF4y2Ba图5gydF4y2Ba仅略有变化,而有一个红色曲线更明显降低。minima-focused直方图更类似于直方图代表过去10 ns的Boltzmann-weighted轨迹比亦然(反映普遍的低EMD值)。这些观察结果允许我们得出两个结论。首先,minima-focused轨迹最初远离他们播种点但不改变在剩下的仿真时间。其次,Boltzmann-weighted轨迹明显远离原来的播种和方法相同的地区2 d地图minima-focused轨迹。这说明,这两个系统在同一方向发展,即使他们部分抽样不同地区的2 d地图的模拟。gydF4y2Ba

图5gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图5gydF4y2Ba。emd的整个轨迹minima-focused播种的直方图的最后10 ns Boltzmann-weighted播种(红色曲线),反之亦然(蓝色曲线)。gydF4y2Ba

最后我们评估这个问题如果MD模拟的收敛可以使用emd被监控。一般来说,一个连续向上或者向下的趋势表明EMD值对应的原子论的合奏尚未聚集。然而,即使EMD曲线明显没有改变在更长一段时间,但这并不意味着一个收敛。我们可以看到gydF4y2Ba图3 dgydF4y2BaEMD情节从25到50 ns的仿真时间三个种植只显示一个非常小的随时间变化的。但是通过比较三个曲线定量,观察高EMD值均匀播种与其他两种方法相比,因此不能融合统一的模拟。总的来说这意味着没有三bmb集合体可以被认为是聚合,额外的模拟时间必须投资覆盖整个相空间和产生,代表实际的原子论的自由能景观。然而,EMD的二维直方图可以额外容易使用和当前non-convergence程度的有效指标。gydF4y2Ba

我们提出的通用工作流在这个手稿兼容任何原子论的力场,水模型或CG模型(只要选择的简历中都提供了原子论的和CG表示)。在gydF4y2BaHunkler et al。(2019)gydF4y2Ba我们演示了使用与不同的CG bmb模型,此外它可以非常有用的二维概率分布的比较各种原子论的或粗粒度的力场。作为一个例子,一个可以比较的结果的概率分布生成的两个力字段用于这项工作(修改GROMOS 54马提尼v2.2 a7和修改)。我们已经表明,生成的二维分布不同,解释这种差异作为CG的缺陷模型(即由于minima-focused EMD曲线的形状)。然而,很难证明二维预测的差异是否源于CG或原子论的模型(或两者)。但是,如果我们现在做相同的比较使用不同的原子论的力场(但同一back-mapped构象开始),我们可以比较两个原子的二维分布和CG模型,以及原子的分布。这可能会导致一个更好的理解差异的起源2 d预测和努力改善仿真模型是有用的决议。gydF4y2Ba

总之,EMD,尤其是用于时间分辨的方式,是一个非常有用的工具来分析(2 d)预测MD的采样相空间轨迹。我们可以使用表明EMD遵循原子论的轨迹(特别播种基于CG模板图的最小值)随时间而进化CG模板。首先接近播种模板然后远离它,暗指EMD曲线修正缺陷的CG地图。这个CG的质量评估模型是最强大的特性之一minima-focused back-mapping抽样为基础。统一播种另一方面主要是有用的为了获得原子论的构象的CG空间尽可能快。然而,如果一个人想要生成一个(接近)聚合原子论的合奏,实际上代表了实际构象景观,Boltzmann-weighted播种是最好的选择。一方面更快在抽样的低能构象比均匀播种(假设CG模型是可行的),另一方面它包括减少偏见的CG地图相比minima-focused播种。gydF4y2Ba

3.3聚类分析gydF4y2Ba

选择的配置和监测开始收敛,bmb方案依赖于2 d CG构型空间的投影。这是一个激进的减少维度考虑tri-Ub的大小。因此我们决定评估质量的这张地图通过执行在高维空间中聚类分析的原子论的配置与bmb取样。这样的集群可以提供一般信息构象的趋势图(类似于齿轮的变化之间的距离乌兰巴托半个所示gydF4y2Ba图1汉英gydF4y2Ba)或显示二维投影可以单独相对类似的构象。此外它允许我们研究个人的行为轨迹,例如,是否同样的构象被采样轨迹从不同的起源开始(即不同的播种计划和不同地区的2 d地图)。这可以补充收敛分析基于emd的3.2节中讨论。考虑系统的大小和复杂性我们使用最近开发的集群方案是专门设计来有效集群大MD轨迹gydF4y2BaHunkler et al。(2022)gydF4y2Ba(见2.3节)。gydF4y2Ba

我们应用集群工作流的原子论的数据组合所有三个播种计划(左上插图gydF4y2Ba图6gydF4y2Ba)。数据集包含744万个构象和30%的这些被分配到61集群后三个迭代聚类过程的(RMSD截止被设置为3)。在2.3节中描述的细节,执行聚类在intermediate-dimensional空间由cc_analysis和由此产生的集群被投射到二维地图。他们所示gydF4y2Ba图6gydF4y2Ba包括tri-Ub结构属于集群(小图)结构包四个例子来演示结构一致性聚类方法获得的(显示集群数据作为他们被分配在聚类过程中,并不反映任何有意义的命令如集群大小)。集群的紧凑放置在地图上显示的2 d地图是一个有意义的表示的高维构象景观——一个属性重要使用投影bmb和单纯的比较和EMD CG抽样。gydF4y2Ba

图6gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图6gydF4y2Ba。预测的61集群结合bmb轨迹(灰色梯度)。包的结构(颜色根据二级结构)选择集群可视化显示的同质性发现集群。左上角插图展示了结合bmb的投影轨迹在最初的CG景观。gydF4y2Ba

所示的着色基于齿轮的距离gydF4y2Ba图1汉英gydF4y2Ba提供了一个通用的对地图的理解。为了得到一个更详细的了解我们展示10集群(包括代表tri-Ub配置)从2 d地图的所有部分gydF4y2Ba图7gydF4y2Ba)。这些集群选择基于其位置的二维投影。构象在地图的左边(示例集群19和59)一般开链构象,这意味着近端和远端延伸到半个相反的方向从中间的一部分。两个集群20(最大的集群包含3.5%的构象)和38在地图的中心采用倒塌的构象,每个三根大致相等的距离。这些都是系统中最稳定的构象。这种稳定的一个可能原因是疏水性补丁在远端和中间半个(主要是周围的部分残留Ile 44和Val 70)导向向其他单位,从而免受溶剂。集群的集群38相交的二维投影20。然而他们仍然认定为两个不同的集群,因为他们是不同的(大部分)在小远端一半的旋转。这是一个很好的例证提出的聚类精度和灵敏度的工作流和其能力最小的结构差异和构象分离到不同的集群。其他例子集群重叠的二维投影但是有小结构差异被聚类在一个更高维的空间环绕gydF4y2Ba图7gydF4y2Ba。集群51和52(右边的地图)中、远端半个球体(绿色)远比在最密集的集群20(中间的地图)。特别是在集群51岁,近端一半几乎是坐落在其他两个之间。集群7情况完全相反,这里远端和中间链更遥远和近端链位于两者之间的其他单位。这里所示的集群确认趋势,我们来自齿轮距离分布。gydF4y2Ba

图7gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图7gydF4y2Ba。选择集群和他们的代表构象bmb投影(一样gydF4y2Ba图6gydF4y2Ba)。在所有的插页情节中间一部分tri-Ub系统定位以同样的方式。红球连着第一残渣,表明近端单元,和一个绿色领域最后残留,说明远端一半。从集群重叠构象2 d地图上空盘旋。gydF4y2Ba

通过使用这种聚类分析我们也可以尝试来验证语句的能力bmb纠正缺陷CG采样使用minima-focused播种。在3.2节,我们认为(基于minima-focused bmb vs CG EMD情节)的原子论的bmb轨迹部分远离该地区在他们被播种的二维投影,从而生成一个原子的二维分布略不同于CG。这个过程可以被视为一个CG固有缺陷模型的修补。为了验证这一点,我们检查一些集群和遵循个人轨迹的2 d景观(gydF4y2Ba图8gydF4y2Ba)。我们重新开始与集群59(左边的地图与扩展构象)。150个独立的轨迹8在左右启动,但离开集群在仿真期间(一个投影的轨迹中说明了gydF4y2Ba图8 cgydF4y2Ba)。gydF4y2Ba图8 dgydF4y2Ba显示集群成员的累积数量59gydF4y2Ba与gydF4y2Ba个人轨迹的仿真时间。这情节说明模拟轨迹确实第一个示例集群59和快速填充它,直到11 ns的仿真时间,但后来的构象被分配到集群减少。从大约25 ns起集群不是扩大。这意味着上半年模拟时间后所有轨迹已开始在这个集群(由于特定区域的高人口重心投影)已经远离它。这个例子中补充修正趋势观察EMD情节(gydF4y2Ba图4gydF4y2Ba)。gydF4y2Ba

图8gydF4y2Ba
www.雷竞技rebatfrontiersin.orggydF4y2Ba

图8gydF4y2Ba。监测采样的三个选择的集群。gydF4y2Ba(一)gydF4y2Ba集群的凸壳36岁,56和59个2 d地图。gydF4y2Ba(B)gydF4y2Ba一个模范的投影轨迹,有助于形成集群36和56。轨迹的基于仿真时间(盯着从红色到蓝色)。gydF4y2Ba(C)gydF4y2Ba一个轨迹,让集群59的例子。gydF4y2Ba(D)gydF4y2Ba的累积数帧导致集群59个人仿真时间。gydF4y2Ba

接下来我们将展示一个例子两个相交的集群36和56由几个原子论的形成轨迹(gydF4y2Ba图8gydF4y2Ba)。gydF4y2Ba图8 bgydF4y2Ba显示了两个选定的轨迹形成这些集群的预测。发起的在这种情况下,四个bmb轨迹和周围的局部最小值CG投影离开他们的种子点,形成集群CG在人口较少的地区的地图。这是另一个例子,单纯的二维分布bmb轨迹分布略不同于CG模板。然而这次,集体bmb轨迹不放弃一个区域的地图,而是共同朝着一个特定的部分不是人口稠密的CG模型。gydF4y2Ba

4结论gydF4y2Ba

我们应用基于back-mapping抽样获得构象自由能景观的一个灵活的多畴的protein-K48-linked tri-ubiquitin-at原子论的决议。bmb引入了更小肽,我们表明,该方法能够非常有效地生成一个正确加权原子论的合奏基于粗粒度的模拟的二维投影。tri-Ub我们首先生成的二维投影的一组广泛的CG模拟的帮助下encodermap降维方法。从预测的结构很长(4µs)原子论的模拟到这2 d地图,我们发现这些模拟只访问了一个非常有限的CG 2 d景观的一部分。采用bmb算法,我们发现整个CG访问映射到原子论的轨迹,即CG模拟实际上没有采样非物质的构象。相反,自由能不同(亚稳)构象状态之间的壁垒太高容易克服的时间表可以原子论的模型。这成功应用bmb tri-Ub说明方法与系统大小尺度很好。此外我们比较不同播种方法发起的原子论的模拟二维投影:最小值集中、玻耳兹曼加权和制服。我们认为波尔兹曼加权播种更有利于保持一个正确的自由能的能力形象一方面,另一方面,探索更大的构象空间的领域。在这种情况下我们也说明和讨论使用EMD指标的比较不同时间分辨的方式(2 d)分布。 Lastly, we employed a recently introduced conformational clustering workflow to the combined atomistic BMBS trajectories. In doing so we illustrate which parts of the 2D map represent which structural conformations. In this context we also show that the encodermap algorithm separates different conformational characteristics very well into different regions of the 2D map, which validates the whole BMBS approach. Finally, we show how individual atomistic BMBS trajectories sample conformational states, move through the 2D map and in sum converge to an atomistic 2D distribution that slightly differs from the CG one, indicating a correction of flaws in the CG template.

数据可用性声明gydF4y2Ba

python笔记本用来分析数据在这项研究中,以及一个最小的例子包括28000年的随机CG结构中可以找到gydF4y2Bahttps://github.com/AG-Peter/BMBS_of_tri-ubiquitingydF4y2Ba。重心轨迹,选择back-mapping分和encodermap预测使用的所有数据中可以找到gydF4y2Bahttps://doi.org/10.48606/40。gydF4y2Ba

作者的贡献gydF4y2Ba

SH执行所有bmb轨迹的模拟和分析数据。结核病由找到合适encodermap参数和通过执行最初的两套原子论的tri-Ub模拟。SH,和CP设计研究。SH,好的,CP写的手稿。所有作者导致修订手稿、阅读和批准提交的版本。gydF4y2Ba

资金gydF4y2Ba

这项工作是支持的DFG CRC 969。此外作者承认支持巴登-符腾堡州的状态通过bwHPC格兰特和德国研究基金会(DFG)本月35/1134-1 FUGG。gydF4y2Ba

确认gydF4y2Ba

我们要感谢Andrej伯格提供CG数据用于这项工作。此外我们感谢Madlen Malcharek有用的评论关于手稿。gydF4y2Ba

的利益冲突gydF4y2Ba

作者声明,这项研究是在没有进行任何商业或财务关系可能被视为一个潜在的利益冲突。gydF4y2Ba

出版商的注意gydF4y2Ba

本文表达的所有索赔仅代表作者,不一定代表的附属组织,或出版商、编辑和审稿人。任何产品,可以评估在这篇文章中,或声称,可能是由其制造商,不保证或认可的出版商。gydF4y2Ba

引用gydF4y2Ba

阿普尔盖特,D。Dasu, T。,Krishnan, S., and Urbanek, S. (2011). “Unsupervised clustering of multidimensional distributions using Earth mover distance,” in第17届ACM SIGKDD学报》国际会议上知识发现和数据挖掘gydF4y2Ba(纽约,纽约,美国:gydF4y2Ba计算机器,协会知识发现(KDD) 11gydF4y2Ba),636 - 644。doi: 10.1145/2020408.2020508gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Bekker, H。,Berendsen, H., Dijkstra, E., Achterop, S., Vondrumen, R., Vanderspoel, D., et al. (1993). “Gromacs - a parallel computer for molecular-dynamics simulations,” in.第四届国际会议上计算物理学gydF4y2Ba。编辑r . DeGroot和j . Nadrchal (gydF4y2Ba物理计算机世界科学出版社出版gydF4y2Ba),252 - 256。92年(PC);会议日期:24-08-1992到28-08-1992。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

伯格,一个。,Franke, L., Scheffner, M., and Peter, C. (2020). Machine learning driven analysis of large scale simulations reveals conformational characteristics of ubiquitin chains.j .化学。理论第一版。gydF4y2Ba16,3205 - 3220。doi: 10.1021 / acs.jctc.0c00045gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

伯格,一个。,Kukharenko, O., Scheffner, M., and Peter, C. (2018). Towards a molecular basis of ubiquitin signaling: A dual-scale simulation study of ubiquitin dimers.公共科学图书馆第一版。医学杂志。gydF4y2Ba14日,e1006589。doi: 10.1371 / journal.pcbi.1006589gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

伯格,一个。,和Peter, C. (2019). Simulating and analysing configurational landscapes of protein–protein contact formation.接口的焦点gydF4y2Ba9日,20180062。doi: 10.1098 / rsfs.2018.0062gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Campello, j·g·b·R。Moulavi D。Zimek,。,和年代一个nder, J. (2015). Hierarchical density estimates for data clustering, visualization, and outlier detection.ACM反式。"。越是加大。数据gydF4y2Ba10,1-51。doi: 10.1145 / 2733381gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Ceriotti, M。,Tribello, G. A., and Parrinello, M. (2011). Simplifying the representation of complex free-energy landscapes using sketch-map.Proc。国家的。学会科学。gydF4y2Ba108年,13023 - 13028。doi: 10.1073 / pnas.1108486108gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

德容,d . H。辛格,G。,Bennett, W. F. D., Arnarez, C., Wassenaar, T. A., Schäfer, L. V., et al. (2013). Improved parameters for the martini coarse-grained protein force field.j .化学。理论第一版。gydF4y2Ba9日,687 - 697。doi: 10.1021 / ct300646ggydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Diederichs, k (2017)。解剖随机和系统噪声综合数据集之间的差异。gydF4y2BaActa Crystallogr。教派。D。gydF4y2Ba73年,286 - 293。doi: 10.1107 / S2059798317000699gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Globisch C。,Krishnamani, V., Deserno, M., and Peter, C. (2013). Optimization of an elastic network augmented coarse grained model to study ccmv capsid deformation.《公共科学图书馆•综合》gydF4y2Ba8,605822 - e60618。doi: 10.1371 / journal.pone.0060582gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Hunkler, S。,D我ederichs, K., Kukharenko, O., and Peter, C. (2022).快构象广泛的分子动力学仿真数据的聚类gydF4y2Ba。gydF4y2Ba提交gydF4y2Ba。gydF4y2Ba

谷歌学术搜索gydF4y2Ba

Hunkler, S。Lemke, T。彼得,C。,和Kukharenko, O. (2019). Back-mapping based sampling: Coarse grained free energy landscapes as a guideline for atomistic exploration.j .化学。理论物理。gydF4y2Ba151年,154102年。doi: 10.1063/1.5115398gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Komander D。,和R一个pe, M. (2012). The ubiquitin code.为基础。学生物化学启。gydF4y2Ba81年,203 - 229。PMID: 22524316。doi: 10.1146 / annurev -生物化学- 060310 - 170328gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Lemke, T。,伯格,一个。,Jain, A., and Peter, C. (2019). EncoderMap(II): Visualizing important molecular motions with improved generation of protein conformations.j .化学。正无穷。模型。gydF4y2Ba59岁,4550 - 4560。doi: 10.1021 / acs.jcim.9b00675gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Lemke, T。,和Peter, C. (2019). EncoderMap: Dimensionality reduction and generation of molecule conformations.j .化学。理论第一版。gydF4y2Ba15日,1209 - 1215。doi: 10.1021 / acs.jctc.8b00975gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Marrink, s . J。,R我年代年代el一个da, H. J., Yefimov, S., Tieleman, D. P., and de Vries, A. H. (2007). The martini force field: Coarse grained model for biomolecular simulations.期刊。化学。BgydF4y2Ba111年,7812 - 7824。doi: 10.1021 / jp071097fgydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Monticelli, L。,Kandasamy, S. K., Periole, X., Larson, R. G., Tieleman, D. P., and Marrink, S. J. (2008). The martini coarse-grained force field: Extension to proteins.j .化学。理论第一版。gydF4y2Ba4,819 - 834。doi: 10.1021 / ct700324xgydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

贝利,O。,和Werman, M. (2009). “Fast and robust Earth mover’s distances,” inIEEE 12计算机视觉国际会议gydF4y2Ba,gydF4y2Ba日本京都gydF4y2Ba,gydF4y2Ba2009年9月29日gydF4y2Ba,460 - 467。doi: 10.1109 / ICCV.2009.5459199gydF4y2Ba

CrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Pickart, c . M。,和Eddins, M. J. (2004). Ubiquitin: Structures, functions, mechanisms.Biochimica Biophysica学报(BBA) -摩尔。细胞Res。gydF4y2Ba1695年,55 - 72。doi: 10.1016 / j.bbamcr.2004.09.019gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

施密德,N。,E我chenberger, A. P., Choutko, A., Riniker, S., Winger, M., Mark, A. E., et al. (2011). Definition and testing of the gromos force-field versions 54a7 and 54b7.欧元。生物物理学J。gydF4y2Ba40岁,843 - 856。doi: 10.1007 / s00249 - 011 - 0700 - 9gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Thach, T . T。Shin D。,汉族,年代。,和lee,年代。(2016). New conformations of linear polyubiquitin chains from crystallographic and solution-scattering studies expand the conformational space of polyubiquitin.Acta Crystallogr。教派。D。gydF4y2Ba72年,524 - 535。doi: 10.1107 / S2059798316001510gydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

Wassenaar, t。Pluhackova, K。,Böckmann, R. A., Marrink, S. J., and Tieleman, D. P. (2014). Going backward: A flexible geometric approach to reverse transformation from coarse grained to atomistic models.j .化学。理论第一版。gydF4y2Ba10日,676 - 690。doi: 10.1021 / ct400617ggydF4y2Ba

《公共医学图书馆摘要》gydF4y2Ba|gydF4y2BaCrossRef全文gydF4y2Ba|gydF4y2Ba谷歌学术搜索gydF4y2Ba

关键词:gydF4y2Ba分子动力学模拟、降维、back-mapping、粗粒化、集群、泛素,polyubiquitingydF4y2Ba

引用:gydF4y2BaHunkler年代,Buhl T,彼得Kukharenko O和C(2023)生成一个泛素链的构象景观原子论的决议由back-mapping抽样为基础。gydF4y2Ba前面。化学。gydF4y2Ba10:1087963。doi: 10.3389 / fchem.2022.1087963gydF4y2Ba

收到:gydF4y2Ba2022年11月02;gydF4y2Ba接受:gydF4y2Ba2022年12月23日;gydF4y2Ba
发表:gydF4y2Ba2023年1月10日。gydF4y2Ba

编辑:gydF4y2Ba

西蒙PobletegydF4y2Ba智利大学南国,智利gydF4y2Ba

审核:gydF4y2Ba

吊艇柱PotoyangydF4y2Ba美国爱荷华州立大学gydF4y2Ba
帕特里夏·索托gydF4y2Ba美国克莱顿大学gydF4y2Ba

版权gydF4y2BaKukharenko©2023 Hunkler Buhl和彼得。这是一个开放分布式根据文章gydF4y2Ba知识共享归属许可(CC)。gydF4y2Ba使用、分发或复制在其他论坛是允许的,提供了原始作者(年代)和著作权人(s)认为,最初发表在这个期刊引用,按照公认的学术实践。没有使用、分发或复制是不符合这些条件的允许。gydF4y2Ba

*通信:gydF4y2Ba克里斯汀•彼得gydF4y2Bachristine.peter@uni-konstanz.degydF4y2Ba

下载gydF4y2Ba