|
意义氨基酸是生命的基石和重要的信号分子。尽管它们具有共同的结构,但目前尚无细胞受体识别氨基酸的通用机制。我们发现了一个简单的基序,它结合了所有主要生命形式的各种受体蛋白中的氨基酸。在人类中,该基序存在于与疼痛和神经发育障碍有关的钙通道亚基中。我们的研究结果表明,γ-氨基丁酸衍生药物与人类蛋白质中与细菌受体中天然配体结合的相同基序结合,从而使未来能够改进重要药物。
摘要
氨基酸是生命的基石,它们也被细菌、古细菌和真核生物中的各种受体识别为信号。尽管它们具有共同的基本结构,但目前还没有已知的氨基酸识别通用机制。在这里,我们展示了 dCache_1 的一个子类(在钙通道和趋化性受体中发现的双结构域,家族 1),一个普遍存在的细胞外感觉结构域,包含一个简单的基序,它识别氨基酸配体的氨基和羧基。我们在整个生命之树中发现了这个主题。在细菌和古生菌中,该基序仅结合氨基酸,包括 γ-氨基丁酸 (GABA),并且存在于所有主要受体类型中。在人类中,该基序存在于与神经性疼痛和神经发育障碍有关的电压门控钙通道的 α2δ-亚基中,以及最近发现的一种 CACHD1 蛋白中。我们的研究结果表明,GABA 衍生药物与人类 α2δ-亚基中的相同基序结合,该基序与细菌化学感受器中的天然 GABA 配体结合。靶蛋白上的确切位置和结合机制可能有助于未来改进针对疼痛和神经生物学疾病的药物。
氨基酸参与多种细胞过程,包括信号转导。它们充当原核生物和真核生物中各种途径的信号。细胞外氨基酸及其衍生物被专用受体识别,例如真核生物中的 G 蛋白偶联受体 (GPCR) 和配体门控离子通道 以及细菌和古细菌中的化学受体。在真核生物中,C 类 GPCR,包括 γ-氨基丁酸 (GABA) 和代谢型谷氨酸受体,在其捕蝇草结构域结合氨基酸配体,而在配体门控离子通道中,例如甘氨酸和 GABA 受体,氨基酸配体与不相关的 β-三明治样结构域结合。在细菌化学感受器中,氨基酸也被不相关的配体结合结构域识别 [例如,四螺旋束、双全螺旋配体结合结构域和 dCache_1(在钙通道和趋化性受体中发现的双结构域,家庭 1)]。目前还没有已知的所有生命领域中都存在的氨基酸传感的共同机制。在这里,我们在 dCache_1 结构域中鉴定了一个简单的保守基序,它为生命之树中不同类型受体的氨基酸传感提供了共同的分子机制。dCache_1 结构域是 Cache 超家族的最大家族——细菌和古细菌中普遍存在的细胞外配体结合传感器,在真核生物中也发现 。dCache_1 结构域在所有主要类型的细菌和古细菌信号转导系统(例如,化学感受器、组氨酸激酶、二鸟苷酸环化酶和磷酸二酯酶、丝氨酸/苏氨酸激酶和磷酸酶)中充当感觉模块,并且它们也存在于真核生物电压门控钙通道中(VGCC) α2δ-亚基。在细菌中,dCache_1 结构域结合各种配体,包括氨基酸、糖、有机酸和核苷酸。配体与膜远端或膜近端结合)结构域的模块,并且诱导的构象变化通过相邻的跨膜螺旋(始终位于 dCache_1 结构域的 C 末端)传播到下游细胞质信号结构域,从而激活激酶或其他信号类型。古细菌 dCache_1 结构域的功能可能类似于细菌中的结构域,因为它们存在于相同类型的信号转导蛋白中;然而,它们在真核生物中的功能仍然未知。
结果与讨论在细菌 dCache_1 域中定义 AA_motif。
在之前的一项研究中,我们表明,在铜绿假单胞菌中,与来自 PctABC(假单胞菌趋化性转导样蛋白 A、B 和 C)化学感受器的 dCache_1 结构域结合氨基酸配体的氨基酸残基在许多同源化学感受器中是保守的。来自 gammaproteobacteria ( 10 )。通过分析已知与氨基酸结合的其他远亲细菌物种的 dCache_1 结构域的几个序列,我们发现相同的位置在所有这些细菌中都是保守的,而这种保守性在已知结合除配体以外的配体的 dCache_1 结构域中丢失了氨基酸(图 1 A和B和SI 附录,表 S1)。基于此序列分析和这些残基在可用三维 (3D) 结构上的位置,我们提出了 dCache_1 结构域中的共有氨基酸结合基序 (AA_motif)(图1C),它由两部分组成。Y121、R126 和 W128(从这里和整个文本中,所有基序位置都根据铜绿假单胞菌化学感受器 PctA 编号,登录号 NP_252999.1)与配体的羧基进行关键接触,包括 N 端基序的一部分,而与配体的氨基形成关键接触的 Y144 和 D173 包括其 C 端部分(图 1 D ),如来自铜绿假单胞菌的化学感受器所证明的,空肠弯曲杆菌 和霍乱弧菌。R126、W128 和 Y129 也被其他人提出作为氨基酸结合的保守决定因素。基序的完整性取决于折叠配体结合口袋中残基的结构排列,在原核生物中,一级序列中 N 端和 C 端部分之间的距离相当短——13 到 17 个氨基酸残基。图 1B )。为了进一步验证 AA_motif 在氨基酸结合中的作用,我们突变了铜绿假单胞菌dCache_1 结构域中的关键残基化学感受器 PctA。R126A 取代导致 PctA 的配体结合亲和力降低 61 倍,而 D173A 取代完全消除了配体结合(图 1 E和SI 附录,图 S1)。类似地,空肠弯曲杆菌中 Tlp3 化学受体和霍乱弧菌中 Mlp37化学受体中这些位置的突变显着降低了氨基酸结合。该基序其他位置的突变也对其他细菌受体中的氨基酸结合产生强烈的负面影响(SI 附录,表 S1)。因此,我们将包含 AA_motif 的 dCache_1 域重命名为 dCache_1AA。
图。1。
dCache_1 域中的 AA_motif。(一)来自铜绿假单胞菌PAO1的 PctA 化学感受器的 dCache_1 结构域与结合的 L-Trp(金;PDB ID 代码 5T7M)。( B ) 实验研究的细菌 dCache_1 结构域与各自配体的蛋白质序列比对。AA_motif(粗体)存在于所有氨基酸结合 dCache_1 结构域(灰色背景)中。( C ) 共识 AA_motif。基序上方的数字对应于 PctA 中的位置。( D ) L-Trp 与 PctA 配体结合口袋中的 AA_motif 残基相互作用。(B-D)这里和所有图中,红色表示与配体羧基配位的残基,蓝色表示与氨基接触的残基。(E ) L-Ala 与野生型和 PctA 突变 dCache_1 结构域结合的等温滴定量热研究。
鉴定和验证来自细菌和古生菌的多种信号蛋白中的 dCache_1AA 结构域。
已知结合氨基酸的 dCache_1AA 结构域列表(图 1 B和SI 附录,表 S1)非常短;它不包含古细菌或真核生物,并且仅具有最新细菌分类学定义的一百多个门中的三个细菌门的代表(19)。因此,我们在整个生命之树中搜索了 dCache_1AA 域的存在。首先,使用 dCache_1 域概况隐马尔可夫模型 (HMM;蛋白质家族数据库 [Pfam] 登录号 PF02743),我们使用 HMMER 工具 ( 20 ) 扫描了来自基因组分类数据库 (19 ) 的 31,910 个代表性细菌和古细菌基因组的蛋白质组。)。这种高度特异性的 HMM 在 86,346 个蛋白质序列中检测到 dCache_1 结构域。接下来,我们构建了这些序列的多序列比对 (MSA),跟踪与广义 AA_motif 定义相对应的 MSA 位置,并选择具有保留 AA_motif 的序列。识别含有 dCache_1AA 的蛋白质的详细程序可在SI 附录、SI 材料和方法中找到。最终数据集包含 10,700 个细菌和 108 个古细菌序列,具有 dCache_1_AA 域(数据集 S1)。分类学分析表明,含有 dCache_1_AA 的蛋白质来自大多数细菌和古菌门的代表,其中至少有 10 个高质量基因组(> 90% 的完整性)可用,表明它们具有广泛的种系分布(数据集 S1)。观察到允许氨基酸结合的 AA_motif 内的某些变异性(数据集 S1)。此外,我们发现约 6% 的含有基序的序列具有 D173N 替换。为了验证这种取代是否导致氨基酸结合的缺乏,我们将其引入铜绿假单胞菌PctA 并表明这种变化导致功能丧失(图 1 E)。总而言之,在这部分研究中,我们在来自大多数细菌和古菌门的数千种蛋白质中鉴定了 dCache_1AA 结构域,包括重要的人类病原体,如鼠疫耶尔森氏菌、霍乱弧菌、肉毒杆菌、嗜肺军团菌和梅毒螺旋体. 这些结构域不仅存在于化学受体中,还存在于所有其他主要受体蛋白中,例如传感器组氨酸激酶、二鸟苷酸环化酶和磷酸二酯酶、丝氨酸/苏氨酸激酶和磷酸水解酶(数据集 S2)。
然后我们进行了两种类型的验证分析。首先,我们从我们最终数据集中的几个先前未研究的蛋白质中模拟了 dCache_1AA 域的结构,代表了不同的细菌和古细菌门。所有模型都揭示了典型 dCache_1 折叠的存在和 AA_motif 残基的特征空间排列(SI 附录,图 S2)。其次,我们进行了生化分析,以证明通过我们的计算分析作为氨基酸传感器的 dCache_1 结构域确实结合了氨基酸。迄今为止,除一个已知的氨基酸感应 dCache_1 结构域外,所有已知的氨基酸感应 dCache_1 结构域都存在于细菌化学感受器中,这些化学感受器仅来自三个细菌门的代表(图 1 B和SI 附录,表 S1)。因此,我们根据以下特征选择用于实验验证的目标:1)分类学,2)受体类型,以及 3)物种致病性状态(图 2和SI 附录,表 S2)。如前所述 ( SI 附录, SI 材料和方法), 使用基于差示扫描荧光法的热位移分析和等温滴定量热法分析配体与重组 dCache_1 结构域的结合。令人满意的是,与选定目标结合的所有配体都是氨基酸(图 2和SI 附录,图 S3-S10 和表 S2)。古细菌蛋白的配体结合亲和力低,而所有细菌蛋白都以高亲和力识别它们的配体(K D值在纳摩尔或更低微摩尔浓度范围内)(图 2),这是功能表征的细菌传感器蛋白的典型特征。这些实验验证了我们的计算预测并证实 1) dCache_1AA 结构域是氨基酸传感器,并且 2) 它们存在于主要类别的细菌和古细菌信号转导蛋白中,包括来自常见病原体的那些。此外,鉴定了细菌丝氨酸/苏氨酸激酶的小分子配体(图2 )。
图 2。
用氨基酸对选定的重组 dCache_1AA 结构域进行微量热滴定。在每个面板中,上图显示原始滴定数据,下图显示使用“单结合位点模型”拟合的滴定数据的积分校正峰面积。每个实验的细节可以在SI 附录表 S2中找到。( A ) V. cholerae(gammaproteobacteria) c-di-GMP 磷酸二酯酶 (NP_233280.1)。( B )鼠疫杆菌(gammaproteobacteria) 化学感受器 (WP_016674185.1)。( C ) L. pneumophila (gammaproteobacteria) 鸟苷酸/腺苷酸环化酶 (WP_154766400.1)。(四)密螺旋体(螺旋体)化学感受器(WP_002687321.1)。( E )嗜热脱硫杆菌(desulfobacterota) c-di-GMP 环化酶 (WP_162138226.1)。( F ) Enhygromyxa salina (myxococcota) 丝氨酸/苏氨酸激酶 (WP_106093935.1)。( G ) Tautonia marina (planctomycetota) 丝氨酸/苏氨酸磷酸酶 (WP_152054232.1)。( H ) Methanospirillum hangatei(archaea, halobacteriota) 传感器组氨酸激酶 (WP_011449640.1)。
在真核生物中搜索 AA_motif。
在真核生物中,Cache 域最初仅在后生动物 VGCC α2δ-亚基 中被识别出来,在那里它们被描述为“不寻常的”和“圆形排列”。后来,这些被重新分类为具有“不确定边界”的 dCache_1 结构域,并在其他一些真核信号转导蛋白中检测到;然而,已知没有配体与这些结构域结合。在人类中,α2δ-亚基在中枢和外周神经系统中广泛表达,并与各种疾病有关,包括精神分裂症、双相情感障碍、自闭症谱系障碍、癫痫和神经性疼痛。α2δ-1- 和 α2δ-2- 亚基与 GABA 衍生药物加巴喷丁、普瑞巴林和米洛巴林结合,这些药物在神经性疼痛病症中具有治疗益处。巧合的是,GABA 是几种细菌化学感受器的 dCache_1AA 结构域的天然配体(SI 附录,表 S1);然而,尚不清楚 GABA 衍生药物是否与 dCache_1 结构域结合,该结构域在 α2δ 中的精确位置也未知。为了找出真核 dCache_1 结构域是否可能包含 AA_motif,我们在几个数据库中搜索了真核 dCache_1 蛋白(SI 附录,SI 材料和方法)) 并跟踪相应域中的 AA_motif 位置,构建 MSA。该分析确定了数百个具有 AA_motif(数据集 S3)的真核序列,包括 α2δ 亚基和最近发现的 CACHD1 蛋白,它们也调节 VGCC,并在丘脑、海马和小脑中高度表达 ( 27 , 28 )。我们还在原生动物谱系中发现了许多以前未识别的 dCache_1 蛋白(数据集 S3)。在 CACHD1 中,AA_motif 被映射到 C 端区域,我们的分析揭示了 dCache_1 域的真核版本(图 3和SI 附录,图 S11)。在 dCache_1 域中未检测到与 α2δ-亚基中的 VGCC_α2 对应的此类基序(图 3)。令人惊讶的是,我们在当前注释为 VWA_N 的域中发现了 AA_motif 的 N 端部分 YxxxxRxWY(位于 VWA [von Willebrand 因子 A 型] 域的 N 端的域;Pfam 登录号 PF08399)。随后将 α2δ 和 CACHD1 与细菌 dCache_1_AA 进行比对表明,细菌序列与被 VWA 结构域分隔的 α2δ 和 CACHD1 蛋白的两个区域很好地比对(SI 附录,图 S11)。在α2δ序列中位于VWA域下游的区域中,我们确定了AA_motif的C端部分,Y[x∼27 to 34]D(图3和SI附录,图S11)。
图 3。
VGCC的α2δ-亚基和CACHD1亚基中的dCache_1AA结构域。( A和B ) Pfam 数据库 ( A ) 和实验研究( B )目前在 α2δ-1 和 CACHD1 蛋白中识别的域。( C ) 本研究揭示的 α2δ-1 和 CACHD1 蛋白的结构域结构。显示了 AA_motif。( D ) 本研究中未发现的α2δ-1-亚基的结构组成显示在已解决的结构上 [PDB ID 代码 6JPA ]。dCache_1AA 远端模块的特写视图(左上) 显示了 AA_motif 残基的空间接近性,尽管插入了 VWA。( E ) α2δ-1-亚基拓扑表明 VWA 域被插入到第一个 dCache_1 域中,而后者又被插入到第二个 dCache_1 域中。
真核生物中的 AA_motif 按顺序拆分但保留在 3D 结构中。
根据我们的发现,我们利用最近发表的兔 VGCC 及其 α2δ-1-亚基的低温电子显微镜 (cryo-EM) 结构来仔细检查 α2δ-结构。对 α2δ-1 亚基结构的仔细评估表明存在两个 dCache_1 结构域和一个 VWA 结构域(图 3)。两个 dCache_1 域都有一个长柄 α-螺旋,α1,然后是上远端和下近端模块。通常在细菌中,dCache_1 结构域两侧有两个跨膜区域,一个在茎 α1-螺旋之前,另一个在膜近端模块之后。然而,兔 α2δ-1 的拓扑跟踪和 MSA 分析表明,C 端 dCache_1(此处称为第二个 dCache_1)的茎 α1-helix 后面不是远端和近端模块,而是茎 α1-helix N 端 dCache_1(这里称为第一个 dCache_1),然后是其部分远端模块(图 3 E)。下一个结构元素是 VWA 域,其后是第一个 dCache_1 远端模块和近端模块的剩余部分,然后顺序进行到第二个 dCache_1 的远端和近端模块。该分析表明第一个 dCache_1 插入到 α1-helix 和第二个 dCache_1 的远端模块之间的环中。此外,它确认 VWA 域被插入到 α4 和 β4 之间的第一个 dCache_1 域中,并拆分了 AA_motif。结果,在一级序列中,其N端和C端部分之间的距离变得比原核生物中的要长得多。值得注意的是,虽然第一个 dCache_1 中的 AA_motif 被 VWA 域插入分割,但远端模块的折叠完好无损,图 3 D和SI 附录,无花果。S12 和 S13 )。α2δ 和 CACHD1 蛋白的切除和连接的 dCache_1 结构域与细菌 dCache_1 结构域完美对齐,并在基本局部比对搜索工具搜索中找到它们(数据集 S4)。接下来,我们对来自铜绿假单胞菌PAO1 化学感受器 PctA 的 dCache_1 结构域与兔 α2δ-1-亚基的两个 dCache_1 结构域进行了成对结构比较。值得注意的是,PctA dCache_1 域与 α2δ-1 亚基的两个 dCache_1 域非常一致。对齐显示了远端和近端模块的基本相同的拓扑结构;然而,额外的二级结构元素存在于 α2δ-1 中,尤其是在第二个 dCache_1 中(SI 附录,图 S12)。
α2δ-1–亚基通过 AA_motif 结合氨基酸配体。
鼠和猪 α2δ-1 中的 R241A 取代(对应于AA_motif 的 PctA N 端部分中的 R126)显示分别完全消除了结合普瑞巴林和加巴喷丁的能力。此外,小鼠 α2δ-1 中的 R241A 取代已显示通过对通道运输的影响导致通过 Ca V 2.2(N 型电压门控钙)通道的二价阳离子电流显着降低。显示亮氨酸和异亮氨酸与 α2δ-1结合并通过亚基 抑制加巴喷丁结合)。为了进一步探索 α2δ-1 中的 AA_motif 是否可以作为结合 GABA 衍生药物和氨基酸的位点,我们对兔 α2δ-1 蛋白和 20 个 α-氨基酸 GABA 的可用结构进行了计算对接实验,以及药物分子加巴喷丁、普瑞巴林和米洛巴林。使用对接结果,我们计算了这些配体与 α2δ-1 之间的极性接触。我们发现所有这些分子都与 AA_motif 残基(数据集 S5)接触。大多数配体与 N 端基序部分的 Y 和 W 残基以及其 C 端部分的 Y 和 D 残基接触(数据集 S5和SI 附录,图 S13)。相对亲和力与可用数据一致。例如,对接实验表明,亮氨酸对 α2δ-1 的亲和力高于异亮氨酸(数据集 S5),这与已发表的实验数据一致。亲和力的顺序米洛巴林>加巴喷丁>普瑞巴林也与最近的实验数据一致。
为了研究哺乳动物 α2δ-1 蛋白中 AA_motif 的 C 末端部分另一个关键位置 (Asp) 突变的影响,我们用大鼠 α2δ-1 中的 Ala 替换 Asp491(对应于 PctA 中的 D173)并测量其在加巴喷丁存在下在 tsA-201 细胞质膜上的表达。我们发现,尽管加巴喷丁抑制 tsA-201 细胞中的野生型 α2δ-1 运输,表现为质膜上的表达降低 43.2 ± 1.8%(100 μM 加巴喷丁)和 55.6 ± 8.4%(1 mM 加巴喷丁),D491A突变消除了加巴喷丁的这种作用(1 mM加巴喷丁抑制10.2±12.0%)(图4)。因此,该残基在真核α2δ-1-蛋白的配体结合中起关键作用。我们之前发现并在此证实了 AA_motif 的 N 末端部分的 R241A 突变的类似结果(1 mM 加巴喷丁抑制 4.2 ± 7.1%)。
图 4。
加巴喷丁损害野生型 (WT) α2δ-1 但不损害 α2δ-1 D491A的细胞表面表达。(一)TSA-201细胞表达血凝素(HA)的代表性图像,标记为α2δ-1-HA WT(第1至3行)和α2δ-1 D491A - HA(第4和5行)(对照;第1行和第1行) 4) 或存在加巴喷丁(GBP;0.1 mM,第 2 行 [WT];1 mM,第 3 行 [WT] 和 5 [D491A])。左图显示非透化条件下的细胞表面 HA 染色(绿色)。中心显示透化后的细胞内 HA 染色(红色)。带有 DAPI(蓝色)染色的细胞核的合并图像显示在右侧。(比例尺:10 μm。)(B)条形图(n的平均值±SEM= 4 个独立实验)用于 WT(左侧三个条)和 D491A(右侧两个条)在不存在 (0) 或存在 0.1 或 1 mM GBP 的情况下的 α2δ-1-HA 的细胞表面表达。对于每个实验,测量了 50 多个细胞的 HA 染色,并将其标准化为 WT 对照的染色。显示了单个实验的点。每种条件下测量的细胞总数如下:WT对照:379(黑色);WT + 0.1 毫米英镑:360(蓝色);WT + 1 mM GBP:449(红色);D491A 对照:351(黑色阴影线);和 D491A + 1 mM GBP:395(红色阴影线)。使用单向方差分析和 Dunnett 事后检验确定 GBP 对细胞表面表达的影响的统计显着性。*** P = 0.0003;**** P < 0.0001。
人和细菌蛋白质以类似的方式结合配体。
我们在结构上将兔 α2δ-1 亚基的第一个 dCache_1 结构域的配体结合模块与 PctA dCache_1 结构域的配体结合模块叠加(SI 附录,图 S13 A)。配体结合口袋的形状和大小相似,考虑到从细菌到哺乳动物的进化时间以及 VWA 插入的存在,这是令人惊讶的。此外,两个结构中的 AA_motif 残基位于几乎相同的位置。接下来,我们仔细检查了带有对接 L-Ile 的兔 α2δ-1-亚基配体结合口袋,并与与 L-Ile 复合的 PctA dCache_1 结构域(PDB ID 代码 5T65)进行了比较(图 5和SI 附录,表S3)。我们观察到配体以类似的方式与这两个分子中的 AA_motif 发生极性接触。L-Ile 的氨基与 AA_motif 的第三个 Y 和最后一个 D 形成氢键,而羧基在 α2δ-1 的第一个 dCache_1 结构域和 PctA 的 dCache_1 结构域中都与 R 和 W 结合(图 5) . 对接实验还表明,L-Leu、加巴喷丁、普瑞巴林和米洛巴林通过 α2δ-1-亚基的 AA_motif 以相同的模式结合(图 5和SI 附录,图 S13 B-D)。AA_motif 的第一个 Y 和 W 与配体羧基配位,第三个 Y(L-Leu 配体除外)和 D 与配体的氨基相互作用。普瑞巴林的羧基通过与 AA_motif 的 R 的氢键额外稳定。
图 5。
细菌和哺乳动物受体通过保守的 AA_motif 结合氨基酸配体。(一)发现结合dCache_1AA的配体的结构比较。( B-E ) 细菌和真核生物 dCache_1AA 的配体结合模式:PctA 与 L-Ile ( B;PDB ID 代码 5T65),α2δ-1 与对接 L-Ile ( C ),PctC 与 GABA ( D;PDB ID )代码 5LTV) 和 α2δ-1 与对接的加巴喷丁 ( E )。( F ) 来自细菌、古生菌和真核生物主要门代表的 dCache_1AA 的蛋白质序列比对。
为了证明该基序能够结合无脊椎动物中的氨基酸及其衍生物,我们使用来自黑腹果蝇的α2δ-蛋白质结构进行了对接实验,该结构由 AlphaFold 、氨基酸配体及其衍生物建模。再次观察到上述配体结合模式(数据集 S5和SI 附录,图 S14)。
CACHD1 和 α2δ-1 具有相似的域架构,但它们的 AA_motifs 排列方式不同。
我们从 AlphaFold 蛋白质结构数据库 中获得了人类 CACHD1 蛋白的结构模型。CACHD1 模型与兔 α2δ-1 冷冻电镜结构的结构比对表明,CACHD1 具有与 α2δ-1 亚基相同的结构组成,有一些差异(图 3和SI 附录,图 S15)。与 α2δ-1-亚基类似,CACHD1 由两个 dCache_1 域组成,一个插入另一个域,VWA 域插入第一个 dCache_1 域。MSA也证实了这些结构部件的存在(SI附录,图S11)。然而,α2δ-蛋白质在 α9-螺旋和 β9-折叠之间的第二个 dCache_1 内具有独特的长插入,而在 CACHD1 蛋白质中它明显更短(SI 附录,图 S11)。α2δ 和 CACHD1 之间的另一个本质区别是 AA_motif 位置。与在第一个 dCache_1 中都携带 AA_motif 的 α2δ-蛋白质不同,CACHD1 蛋白在第二个 dCache_1 的远端模块中具有完整的 AA_motif(图 3和SI 附录,图 S11)。为了深入了解 CACHD1 的配体结合能力,我们将氨基酸和 GABA 衍生的药物分子对接到建模人类 CACHD1 结构的第二个 dCache_1 结构域的远端模块。配体按照上述模式与 AA_motif 残基形成氢键(数据集 S5和SI 附录,图 S14);AA_motif 的 N 端部分的 R 和 W 配位配体羧基,而基序 C 端部分的 Y 和 D 与配体的氨基相互作用。本质上,用 AlphaFold 建模的黑腹果蝇CACHD1 蛋白结构观察到相同的配体结合模式(数据集 S5和SI 附录,图 S14)。
真核生物中氨基酸结合 dCache_1 结构域的进化。
为了确定真核生物中 AA_motif 的流行及其进化历史,我们分析了来自多个数据库(SI 附录、SI 材料和方法)的可用真核基因组。我们发现含有 dCache_1AA 的蛋白质几乎存在于所有主要的真核生物群中(国家生物技术信息分类中心):眼虫、异叶藻、SAR(原生藻、泡孔和根瘤菌超群)、Haptista、Choanoflagelida、Archaeplastida 和 Metazoa(图 1)。 6和数据集 S3)。我们无法在被子植物(开花植物)、真菌和两个原生动物谱系的任何基因组中检测到 dCache_1AA 蛋白,它们可能在这些谱系中丢失了。dCache_1 所属的 Cache 超家族 (Pfam CL0165) 的域已被证明具有细菌起源,它们在古细菌和真核生物中的存在归因于水平基因转移。我们发现在所有包含 dCache_1 结构域的真核蛋白质中,VWA 结构域都插入其中一个,这表明这种插入可能发生在最后一个真核共同祖先 (LECA) 中。我们发现含有两个 dCache_1 结构域的蛋白质存在于真核生物的所有分支中,其中一个(带有 VWA 插入)插入另一个结构域。此外,我们鉴定了仅包含一个 dCache_1(带有 VWA 结构域插入)的蛋白质。所有这些蛋白质都存在于多种真核生物中,不包括脊椎动物(图 6和SI 附录,图 S16)。因此,围绕 LECA 发生了两个事件:1) 将 VWA 域插入到 dCache_1 域中,以及 2) 将此 dCache_1-VWA 模块插入到另一个 dCache_1 域中。许多原生生物和无脊椎动物具有两种类型的含有蛋白质的 dCache_1AA 结构域:一种具有带有 VWA 插入的单个 dCache_1 结构域,另一种具有两个 dCache_1 结构域,其中一种具有 VWA 插入(SI 附录,图 S16)。值得注意的是,在链霉菌进化枝的一些成员中,具有 VWA 插入的 dCache_1AA 结构域存在于丝氨酸/苏氨酸激酶中,类似于一些含有 dCache_1 的细菌蛋白质(图 6)。
图 6。
横跨生命之树的 AA_motif。( A ) dCache_1AA 在主要生命谱系中的分布。尖端带有点的粗线表示存在 AA_motif。显示了相关生物的位置。红色圆圈表示 dCache_1AA 向古细菌的水平基因转移。橙色圆圈表示大约同时发生的三个事件 (LECA):1) dCache_1AA 从细菌到真核生物的水平转移,2) VWA 域插入,以及 3) 第一个 dCache_1 插入到第二个 dCache_1 域中。(乙) 显示了在每个生命域中发现的包含蛋白质的 dCache_1AA 的普遍域架构。域定义根据 Pfam 域命名法:EAL (PF00563),一种二鸟苷酸磷酸二酯酶;GGDEF (PF00990),一种二鸟苷酸环化酶;Guanylate_cyc (PF00211),一种腺苷酸或鸟苷酸环化酶;HATPase_c (PF02518),一种组氨酸激酶;HD (PF01966),磷酸水解酶;MCPsignal (PF00015),甲基接受趋化蛋白(chemoreceptor);激酶 (PF00069),丝氨酸/苏氨酸激酶;Spoiie (PF07228),丝氨酸/苏氨酸磷酸酶。
为了进一步了解包含两个 dCache_1 结构域的蛋白质之间的进化关系,我们分别使用最大似然估计和贝叶斯推理推断了两个系统发育树。这些树彼此高度一致。我们使用贝叶斯树进行后续分析(SI附录,图S17),它揭示了两个簇:α2δ 和 CACHD1。α2δ-簇仅包含后生动物序列,包括来自人类基因组的四种 α2δ-蛋白质。在脊椎动物中,α2δ-1- 和 α2δ-2- 序列形成一个组,而 α2δ-3 和 α2δ-4 形成另一组。这表明脊椎动物中的一个原始α2δ-祖先复制,产生了α2δ-1/α2δ-2-和α2δ-3/α2δ-4-祖先,随后的复制导致了四个当前的旁系同源物。硬骨鱼中的 α2δ-蛋白质经历了额外的重复(SI 附录,图 S16 和 S17)。
CACHD1 簇包括人类基因组中编码的一种蛋白质 CACHD1 和来自后生动物的蛋白质(SI 附录,图 S17)。脊椎动物只有一个 CACHD1 拷贝,而脊椎动物之前的生物体具有不同数量的旁系同源蛋白(SI 附录,图 S16 和 S17)。在树的根部和靠近它的地方,有一些蛋白质在两个 dCache_1 结构域的远端模块中都保留了 AA_motif,这表明祖先蛋白质在两个 dCache_1 结构域中都具有 AA_motif(也受到系统分布模式的支持) (SI附录,图S16)。在进化过程中,AA_motif在不同的生物群落中不同程度地丢失(SI附录,图S17)。脊椎动物之前的真核生物具有来自所有描述组的 dCache_1AA 蛋白:单个 dCache_1AA 蛋白、来自 α2δ 和 CACHD1 簇的蛋白质,以及在双 dCache_1 蛋白的两个结构域中都保留有 AA_motif 的“双 AA_motif”蛋白(SI 附录,图 1)。 S16 )。系统发育重建表明源自这个早期双 AA_motif 组的蛋白质重复产生了 α2δ 和 CACHD1 簇(SI 附录,图 S16 和 S17)。在α2δ-蛋白质中,AA_motif 主要保留在第一个 dCache_1 结构域中,而在 CACHD1 蛋白质中,它位于第二个 dCache_1 结构域中。我们的分析还表明,α2δ-亚基的第一个 dCache_1 域比第二个 dCache_1 处于更强的选择压力下;相反,CACHD1 蛋白的两个 dCache_1 结构域都处于强选择压力下(SI 附录,SI 材料和方法)。系统发育分析和序列相似性搜索(数据集 S4)不允许我们明确得出结论,哪个确切的细菌群可以产生真核蛋白。
结论
在这项工作中,我们描述了一种通用的氨基酸结合传感器,它存在于整个生命之树中。我们展示了这些传感器通过一个简单的氨基酸识别基序结合氨基酸配体,该基序已保存超过 30 亿年并用于所有主要的细胞生命形式。我们将特定的生物学功能——氨基酸感应——分配给细菌、古细菌和真核生物中的数千个受体。它对人类病原体尤其重要,因为氨基酸是致病性的关键介质。编码在各种生物体基因组中的绝大多数传感器蛋白仍未被研究,它们识别的信号也是未知的。由于极端的序列变异和感觉域的复杂进化轨迹,单靠序列分析无法识别它们。另一方面,只能对基因组数据库中可识别的一小部分传感器蛋白进行结构研究和生化表征。在这里,我们展示了如何结合这两种策略来精确预测一类重要的生物信号。类似的方法很可能可用于其他类别的传感器蛋白的功能注释。在本研究过程中,我们鉴定了医学上重要的 CACHD1 蛋白和 VGCC 的 α2δ-亚基中的 AA_motif,并将其作为人类 α2δ-亚基中 GABA 衍生药物的结合位点。这一发现为改进针对各种神经生物学疾病的药物提供了机会。
材料和方法
本研究中使用的公共数据库和生物信息学工具在SI 附录中有详细描述。SI 附录中还提供了鉴定原核生物和真核生物中含有 AA_motif 的蛋白质的详细程序。使用 AutoDock Vina ( 39 )进行计算对接。MSA 是使用 MAFFT 构建的。系统发育推断是使用 RaXML和 MrBayes 进行的。使用 TREND进行蛋白质结构域的鉴定和分析。
使用已发布的方案进行蛋白质表达、纯化、热位移测定、等温滴定量热法和细菌和古细菌蛋白质的位点特异性诱变,并在SI 附录中进行了详细描述。如前所述 进行钙通道 α2δ-1 亚基的成像细胞表面表达,详细信息在SI 附录中提供。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|