五爪金龙叶绿体基因组特征分析
黄琼林1, 陈依虹2, 叶晓霞1, 谭靖怡3, 梁秋婷2, 吴民华1     
1. 广东医科大学基础医学院,广东湛江 524023;
2. 广东医科大学第一临床医学院,广东湛江 524023;
3. 广东医科大学药学院,广东湛江 524023
摘要: 为了阐明药用植物五爪金龙Ipomoea cairica的叶绿体基因组特征,选用五爪金龙叶片为样品,采用试剂盒法提取DNA并建立测序文库,随后使用新一代细胞器基因组测序技术进行高通量测序,并利用生物信息学手段进行序列组装和特征分析。结果显示,五爪金龙叶绿体基因组为环状双链四分体分子,全长161 780 bp,由88 205 bp的大单拷贝区(Large Single Copy,LSC)、30 747 bp的反向重复区(Inverted Repeat,IR)A、12 081 bp的小单拷贝区(Small Single Copy,SSC)和30 747 bp的反向重复区B(IRB)排列而成,含有131个基因;共有28 757个密码子,偏好使用以A或T结尾的密码子;存在67个简单重复序列(Simple Sequence Repeat,SSR),并以A/T单核苷酸重复居多。五爪金龙与近缘植物在IRB-SSC边界之间存在较为明显的变异,与同属三裂叶薯I.triloba、番薯I.batatas等的亲缘关系更近。本研究报道了五爪金龙叶绿体基因组的结构和序列组成,并分析其特征,为五爪金龙的物种鉴定、遗传进化及开发利用提供了基因组信息。
关键词: 五爪金龙    叶绿体基因组    密码子偏好性    简单重复序列    系统进化关系    
Characteristics of the Chloroplast Genome of Ipomoea cairica
HUANG Qionglin1, CHEN Yihong2, YE Xiaoxia1, TAN Jingyi3, LIANG Qiuting2, WU Minhua1     
1. School of Basic Medicine, Guangdong Medical University, Zhanjiang, Guangdong, 524023, China;
2. The First Clinical Medical College, Guangdong Medical University, Zhanjiang, Guangdong, 524023, China;
3. School of Pharmacy, Guangdong Medical University, Zhanjiang, Guangdong, 524023, China
Abstract: To clarify the chloroplast genome features of Ipomoea cairica, this study used a kit to extract DNA from the leaves of I.cairica and then constructed the sequence library. The next-generation sequencing was employed for high-throughput organelle sequencing, and then bioinformatics tools were used to assemble and analyze the sequences. The results showed that the chloroplast genome of I.cairica was a circular quadripartite structure with a total length of 161 780 bp, which was composed of a Large Single Copy (LSC, 88 205 bp), an Inverted Repeat A (IRA, 30 747 bp), a Small Single Copy (SSC, 12 081 bp), and an Inverted Repeat B (IRB, 30 747 bp). A total of 131 genes were embodied in the chloroplast genome. The genome contained 28 757 codons, among which those ended with A/T were frequently used. There were 67 Simple Sequence Repeats (SSR), which were dominated by the mononucleotide repeat A/T. I.cairica showed significant variations with related species at the boundary between IRB and SSC and shared close relationship with I.triloba and I.batatas. This work reports and characterizes the chloroplast genome of I.cairica, which will provide genome data for species identification, phylogenetic relationship research, and development and utilization of this herbal medicine.
Key words: Ipomoea cairica    chloroplast genome    codon bias    simple sequence repeat    phylogenetic relationship    

叶绿体基因组是绿色植物特有的质体DNA体系,含有丰富的遗传信息。叶绿体基因组的结构保守,通常包括一对序列相同但方向相反的反向重复区(Inverted Repeat,IR),它们将叶绿体基因组的其余部分分隔成序列不同的两个单拷贝区(Single Copy,SC),其中序列较长的称为大单拷贝区(Large Single Copy,LSC),较短的则称为小单拷贝区(Small Single Copy,SSC),整体上呈现为环状双链四分体[1, 2]。叶绿体基因组是当前药用植物研究领域的新热点,在药用植物的物种鉴定[3]、遗传进化[4]、居群多样性[5]等多个方面均有普遍应用。

五爪金龙Ipomoea cairica为旋花科Convolvulaceae番薯属Ipomoea多年生缠绕草本植物,主要分布于广东、广西、福建等省区[6]。五爪金龙具有清热解毒、利水通淋的功效,主治肺热咳嗽、小便不利、淋病、水肿、疮痈肿毒等[7]。五爪金龙原为外来入侵杂草,可攀爬缠绕覆盖于灌木和乔木上,争夺本土物种的生存空间和养分,但如今已驯化栽培为观赏性植物[8]。药理研究发现,五爪金龙的提取成分具有明显的抗高血糖、抗肿瘤、抑制HIV-1病毒复制[9]以及镇痛[10]作用。此外,五爪金龙的醇提成分东莨菪亭内酯可以很好地抑制香蕉枯萎病病原菌的生长[11]、杀灭福寿螺[12, 13],并能促进水稻幼苗的生长[12],是环境友好型植物源农药的潜在原料。因此,五爪金龙具有较高的药用价值和农用开发潜力。

目前,对于五爪金龙的研究还很有限,主要集中在化学成分研究、生物防治等方面,而其叶绿体基因组相关信息匮乏,遗传分类位置及系统发育关系尚未明确,限制了五爪金龙进一步的开发利用。因此,本研究开展五爪金龙的叶绿体基因组高通量测序,采用生物信息学方法分析其叶绿体基因组的结构和序列、密码子偏好性以及简单重复序列(Simple Sequence Repeat,SSR)特点,并将五爪金龙的叶绿体基因组与相关近缘物种的进行序列比对,同时基于序列相似度构建系统进化树,厘清五爪金龙的系统进化关系,以期从基因组层面为五爪金龙的物种鉴定、系统发育及开发利用等提供科学依据。

1 材料与方法 1.1 五爪金龙的收集及其叶绿体基因组测序

五爪金龙采收于广东省广州市荔湾区海北南村,取其叶片放入装有干燥剂的样品袋保存备用。使用磁珠法植物DNA提取试剂盒(北京康为世纪生物科技公司)提取五爪金龙的基因组DNA,使用NexteraXT DNA文库制备试剂盒(美国因美纳公司)构建DNA测序文库,随后运用Novaseq高通量测序平台(美国因美纳公司)进行五爪金龙的叶绿体基因组全测序。

1.2 叶绿体基因组的组装和注释

参照Jin等[14]报道的方法,将测序所得并经过滤后的读序导入SPAdes 3.11.0软件进行组装,k-mer值为21、45、65、85、105,采用Bandage软件对组装结果进行可视化和编辑成环,获得的环状DNA即为五爪金龙叶绿体基因组。首先,将组装好的五爪金龙叶绿体基因组导入GenBank数据库进行BLAST比对;然后使用Plastid Genome Annotator软件进行基因注释,并运用OGDRAW软件绘制结构图谱;最后通过BankIt软件将组装和注释好的五爪金龙叶绿体基因组提交至GenBank数据库,序列登记号为OR750855。

1.3 叶绿体基因组的特点分析

参照黄琼林等[15, 16]的研究,采用CodonW软件计算五爪金龙叶绿体基因组密码子的相对同义密码子使用情况(Relative Synonymous Codon Usage,RSCU)值,将RSCU值大于1的密码子定为高频使用密码子,以分析五爪金龙叶绿体基因组的密码子使用偏好性。使用MISA软件分析五爪金龙叶绿体基因组SSR的组成和分布,纳入分析的SSR包括单、二、三、四、五和六核苷酸重复序列,并且它们的最小重复数依次为10、5、4、3、3、3。使用IRscope软件比较五爪金龙与从GenBank数据库下载的三裂叶薯I.triloba、番薯I.batatas、圆叶牵牛I.purpurea、牵牛I.nil等近缘物种叶绿体基因组的IR/SC边界差异。

1.4 系统进化分析

在GenBank数据库下载已发布的旋花科番薯属植物三裂叶薯、番薯、圆叶牵牛、牵牛、月光花I.alba,旋花科银背藤属Argyreia植物黄毛银背藤A.velutina,旋花科旋花属Convolvulus植物田旋花C.arvensis,旋花科马蹄金属Dichondra植物马蹄金D.micrantha,旋花科丁公藤属Erycibe植物丁公藤E.obtusifolia、台湾丁公藤E.henryi,唇形科Lamiaceae黄芩属Scutellaria植物黄芩S.baicalensis、藏黄芩S.kingiana、灰岩黄芩S.forrestii以及百合科Liliaceae百合属Lilium植物百合L.brownii的叶绿体基因组序列,与本研究测得的五爪金龙叶绿体基因组序列一并导入MAFFT v7.427软件中进行多重比对,随后采用RAxML 8.2.12软件构建系统进化树,建树模型为GTRGAMMA,自展检验支持值为1 000。

2 结果与分析 2.1 五爪金龙叶绿体基因结构

图 1可见,五爪金龙叶绿体基因组为161 780 bp的环状双链四分体分子,其中LSC长度为88 205 bp,SSC长度为12 081 bp,穿隔在它们之间的反向重复区(IRA)和反向重复区B(IRB)长度均为30 747 bp,整个基因组的平均GC含量为37.6%。五爪金龙叶绿体基因组共含有131个基因,包括蛋白质编码基因(Protein Coding Gene, PCG)86个、核糖体RNA(ribosmal RNA,rRNA)编码基因8个以及转运RNA(transfer RNA,tRNA)编码基因37个。其中trnK-UUUrps16trnG-UCCatpFrpoC1trnL-UAAtrnV-UACpetBpetDrpl16ndhBtrnI-GAUtrnA-UGCndhA基因各含有1个内含子,clpPycf3基因各含有2个内含子。从功能上来看,与五爪金龙光合作用相关的基因有47个,调控五爪金龙叶绿体自我复制的基因有73个,其他功能的基因有5个,未知功能的基因有6个。

图 1 五爪金龙叶绿体基因组图谱 Fig. 1 Chloroplast genome map of Ipomoea cairica

2.2 密码子偏好性分析

五爪金龙叶绿体基因组共包含28 757个密码子,包括61种28 671个氨基酸编码密码子以及3种86个终止密码子。由图 2可知,五爪金龙叶绿体基因组密码子共编码20种氨基酸,除了甲硫氨酸(Met)和色氨酸(Trp)由1种密码子编码外,其他18种氨基酸均由2-6种密码子同义编码。有30种密码子的RSCU值大于1,表明与其他同义密码子相比,这些密码子在编码氨基酸或终止氨基酸翻译时使用频率更高。在这些高频使用密码子中,除了编码亮氨酸(Leu)的密码子TTG是以C/G为末位碱基外,其余29种密码子均以A/T为末位碱基,说明五爪金龙叶绿体基因组倾向使用以A/T结尾的密码子来编码氨基酸或终止氨基酸翻译。

Ala: Alanine; Arg: Arginine; Asn: Asparagine; Asp: Aspartate; Cys: Cysteine; Glu: Glutamate; Gln: Glutamine; Gly: Glycine; His: Histidine; Ile: Isoleucine; Leu: Leucine; Lys: Lysine; Met: Methionine; Phe: Phenylalanine; Pro: Proline; Ser: Serine; Thr: Threonine; Trp: Tryptophan; Tyr: Tyrosine; Val: Valine; End: Ending codon; The number in the column was RSCU value of the below codon with corresponding color. 图 2 五爪金龙叶绿体基因组的相对同义密码子使用情况 Fig. 2 Relative synonymous codon usage of I.cairica chloroplast genome

2.3 SSR特点分析

表 1所示,五爪金龙叶绿体基因组共检索到67个SSR,包括单、二、三、四和五核苷酸重复序列等5种类型。从组成上看,单核苷酸SSR数量最多,占所有SSR的71.6%(48/67);其次是四核苷酸SSR,占比14.9%(10/67),最少的是二核苷酸SSR,仅占3.0%(2/67)。单核苷酸SSR全部是A/T重复基序,由此可见五爪金龙叶绿体基因组SSR主要是由polyA或polyT构成。从分布来看,五爪金龙叶绿体基因组SSR大多数处于LSC内,占比77.6%(52/67);其次是在IR内,约占17.9%(12/67);位于SSC内的最少,仅有4.5%(3/67),可见五爪金龙叶绿体基因组SSR分布不均,具有较为明显的多态性。

表 1 五爪金龙叶绿体基因组SSR组成和分布 Table 1 Composition and distribution of SSRs in I.cairica chloroplast genome
类型
Type
重复基序
Motif
数量
Number
所在区域
Distribution
LSC SSC IR
Mononucleotide A/T 48 38 2 8
Dinucleotide AT/AT 2 2 0 0
Trionucleotide AAG/CTT 2 2 0 0
AAT/ATT 1 1 0 0
AGG/CCT 1 1 0 0
Tetranucleotide AAAC/GTTT 1 1 0 0
AAAG/CTTT 2 2 0 0
AAAT/ATTT 3 3 0 0
AATC/ATTG 1 1 0 0
AGAT/ATCT 3 0 1 2
Pentanucleotide AATAG/ATTCT 2 0 0 2
AATTC/AATTG 1 1 0 0
Total 67 52 3 12

2.4 IR边界比较分析

叶绿体基因组IR区两侧边缘的位置称为IR边界。IRB、IRA在邻近LSC和SSC处均分别存在1个IR边界,依次称为JLB、JSB、JSA和JLA。5种旋花科番薯属植物叶绿体基因组的IR边界如图 3所示,5种植物的JLB均在rpl23trnI之间的基因间隔区,距离rpl23约100 bp左右,差距微小。五爪金龙与其他4种植物的JSB存在较大的差异,五爪金龙的JSB位于ndhA内,而其他植物的JSB均位于ndhHndhF之间的基因间隔区。5种植物的JSA都位于ndhA基因内,在距离该基因5′端的485或484 bp处。5种植物的JLA较为相似,均处在trnItrnH基因之间的基因间隔区。

图 3 5种番薯属植物叶绿体基因组IR边界的比较 Fig. 3 Comparison on IR boundaries of chloroplast genomes from five Ipomoea plants

2.5 系统进化分析

基于叶绿体基因组序列构建的五爪金龙系统进化树如图 4所示,五爪金龙与三裂叶薯、番薯、圆叶牵牛、牵牛、月光花最先聚集在一起,形成旋花科番薯属分支,随后旋花科番薯属再先后与银背藤属、旋花属、马蹄金属、丁公藤属等共同聚成旋花科分支;唇形科植物也分别聚成相应的分支。

图 4 基于叶绿体基因组构建的五爪金龙系统进化树 Fig. 4 Phylogenetic tree of I.cairica based on chloroplast genome

3 讨论

叶绿体基因组的构成相对简单且其序列容易获取,变异率适中,能为物种鉴定和系统发育提供丰富的遗传信息。近年来随着高通量测序技术的迅速发展和成本降低,叶绿体基因组已成为植物间亲缘关系鉴定和遗传多样性检测的常用“工具”[2, 17]。本研究获得了五爪金龙的叶绿体基因组序列,全长161 780 bp,是由LSC、IRA、SSC及IRB顺次连接构成的环状双链四分体,编码131个基因,以与光合作用和叶绿体自身复制相关的基因居多。五爪金龙叶绿体基因组的结构和组成均符合植物叶绿体基因组的典型特征[18, 19],与密花豆Spatholobus suberectus[20]、紫皮石斛Dendrobium devonianum [21]等大多数植物相似。

植物在进化过程中会倾向使用特定的一或几种密码子来编码氨基酸,此现象称为密码子偏好性[22]。本研究发现,在五爪金龙叶绿体基因组的密码子中,有30种密码子的RSCU值大于1,且其中29种密码子的第三位碱基是A/T,表明五爪金龙在进化进程中形成了较为明显的密码子偏好性,倾向使用以A/T结尾的密码子。五爪金龙叶绿体基因组密码子偏好性与叶菜型甘薯Dioscorea esculenta[23]、长叶竹柏Nageia fleuryi[24]等多数植物相同。

SSR是植物基因组广泛存在的一种高频重复的DNA短序列,通常用于修饰与其相关的基因,增加或减少其重复单位会对基因调控、转录和蛋白质功能产生影响。由于其特殊的突变和功能特性,SSR在研究物种因适应性进化而导致的遗传变异上发挥着重要作用[25]。本研究从五爪金龙的叶绿体基因组中检测出67个SSR,它们以A/T单核苷酸重复居多,该特征与五爪金龙叶绿体基因组的低GC含量相关,也与露兜树Pandanus tectorius[26]、桔梗Platycodon grandiflorus[27]等多种植物的SSR情况相似。SSR分析结果可为后续五爪金龙DNA分子标记的开发和应用提供基础数据。

叶绿体基因组IR在进化过程中容易发生扩张和收缩,从而在不同物种之间产生长度以及边界位置的差异[28]。本研究发现,五爪金龙与其他4种番薯属物种的叶绿体基因组IR的长度较为相近,为30 747-30 890 bp,且4个IR边界总体上相似度较高,但五爪金龙的JSB与其他4种植物不同,提示叶绿体基因组在番薯属的物种鉴定上有较大的应用潜力。本研究基于叶绿体基因组建成的系统进化树聚类效果良好,直观地呈现了五爪金龙在旋花科中的进化位置,五爪金龙与三裂叶薯、番薯、圆叶牵牛、牵牛、月光花等同属物种具有较近的亲缘关系,与传统植物分类学相符。

4 结论

五爪金龙叶绿体基因组具有环状双链四分体式结构,其序列长度为161 780 bp,平均GC含量为37.6%,包含131个基因,并且偏好使用以A/T结尾的密码子。五爪金龙叶绿体基因组SSR以polyA或polyT单核苷酸为主。从叶绿体基因组序列相似程度来看,五爪金龙与三裂叶薯、番薯等同属植物具有较近的亲缘关系。本研究获得了五爪金龙完整的叶绿体基因组序列,并通过密码子偏好性、SSR、IR边界、系统进化关系等分析系统地探讨了其结构和序列特点,从基因组水平为今后五爪金龙的资源利用和产品开发奠定了基础。

参考文献
[1]
孙孟涛, 张峻鑫, 黄体冉, 等. 虎杖叶绿体基因组结构与变异分析[J]. 生物工程学报, 2022, 38(5): 1953-1964.
[2]
DANIELL H, LIN C S, YU M, et al. Chloroplast genomes: diversity, evolution, and applications in genetic engineering[J]. Genome Biology, 2016, 17(1): 134. DOI:10.1186/s13059-016-1004-2
[3]
LI F, XIE X N, HUANG R, et al. Chloroplast genome sequencing based on genome skimming for identification of Eriobotryae Folium[J]. BMC Biotechnology, 2021, 21(1): 69. DOI:10.1186/s12896-021-00728-0
[4]
LI W Q, LIU Y L, YANG Y, et al. Interspecific chloroplast genome sequence diversity and genomic resources in Diospyros[J]. BMC Plant Biology, 2018, 18(1): 210. DOI:10.1186/s12870-018-1421-3
[5]
WANG Y H, WANG S, LIU Y L, et al. Chloroplast genome variation and phylogenetic relationships of Atractylodes species[J]. BMC Genomics, 2021, 22(1): 103. DOI:10.1186/s12864-021-07394-8
[6]
中国科学院中国植物志编辑委员会. 中国植物志: 64卷[M]. 北京: 科学出版社, 1979: 97.
[7]
国家中医药管理局《中华本草》编委会. 中华本草: 6卷[M]. 上海: 上海科学技术出版社, 1999: 512.
[8]
余细红, 李韶山. 外来入侵植物五爪金龙的防治及其资源化利用展望[J]. 湖北农业科学, 2019, 58(4): 5-9.
[9]
SCHRÖDER H C, MERZ H, STEFFEN R, et al. Differential in vitro anti-HIV activity of natural lignans[J]. Zeitschrift Für Naturforschung C: A Journal of Biosciences, 1990, 45(11/12): 1215-1221.
[10]
FERREIRA A A, AMARAL F A, DUARTE I D G, et al. Antinociceptive effect from Ipomoea cairica extract[J]. Journal of Ethnopharmacology, 2006, 105(1/2): 148-153.
[11]
顾承真, 高钰杰, 邱子宿, 等. 五爪金龙抑制香蕉枯萎病有效成分的鉴定与抑菌效果分析[J]. 福建农业科技, 2022, 53(7): 23-26.
[12]
胡飞, 曾坤玉, 张俊彦, 等. 五爪金龙乙醇提取物对福寿螺毒杀和水稻苗生长的影响[J]. 生态学报, 2009, 29(10): 5471-5477.
[13]
犹昌艳, 杨宇, 胡飞, 等. 五爪金龙中香豆素类物质含量及其对福寿螺、水稻和稗草的影响[J]. 生态学报, 2014, 34(7): 1716-1724.
[14]
JIN J J, YU W B, YANG J B, et al. GetOrganelle: a fast and versatile toolkit for accurate de novo assembly of organelle genomes[J]. Genome Biology, 2020, 21(1): 241. DOI:10.1186/s13059-020-02154-5
[15]
黄琼林. 高良姜叶绿体基因组测序与特征分析[J]. 热带作物学报, 2021, 42(1): 1-6.
[16]
黄琼林, 叶晓霞, 谭靖怡, 等. 半边旗叶绿体基因组及其结构分析[J]. 中药新药与临床药理, 2023, 34(9): 1288-1295.
[17]
樊守金, 郭秀秀. 植物叶绿体基因组研究及应用进展[J]. 山东师范大学学报(自然科学版), 2022, 37(1): 22-31.
[18]
BENDICH A J. Circular chloroplast chromosomes: the grand illusion[J]. The Plant Cell, 2004, 16(7): 1661-1666. DOI:10.1105/tpc.160771
[19]
ZHANG Y, DU L, LIU A, et al. The complete chloroplast genome sequences of five epimedium species: lights into phylogenetic and taxonomic analyses[J]. Frontiers in Plant Science, 2016, 7: 306.
[20]
吴民华, 叶晓霞, 谭靖怡, 等. 密花豆叶绿体基因组序列特征及密码子偏好性分析[J]. 南方农业学报, 2023, 54(6): 1633-1645.
[21]
尚明越, 王嘉乐, 周莹, 等. 濒危紫皮石斛叶绿体基因组结构及系统发育分析[J]. 中草药, 2023, 54(19): 6424-6433.
[22]
MA L N, CUI P, ZHU J, et al. Translational selection in human: more pronounced in housekeeping genes[J]. Biology Direct, 2014, 9: 17. DOI:10.1186/1745-6150-9-17
[23]
李国良, 张鸿, 林赵淼, 等. 叶菜型甘薯叶绿体基因组及其特征分析[J]. 西南大学学报(自然科学版), 2023, 45(10): 43-53.
[24]
颜丽, 孔维杰, 杨雪莲, 等. 长叶竹柏叶绿体基因组特征及系统发育分析[J]. 种子, 2023, 42(7): 10-17, 封2.
[25]
KASHI Y, KING D G. Simple sequence repeats as advantageous mutators in evolution[J]. Trends in Genetics, 2006, 22(5): 253-259. DOI:10.1016/j.tig.2006.03.005
[26]
吴民华, 邹振宁, 叶晓霞, 等. 露兜树叶绿体基因组结构与序列特征分析[J]. 中药新药与临床药理, 2023, 34(1): 115-122.
[27]
张瑜, 杜晨晖, 詹海仙, 等. 桔梗叶绿体比较基因组学分析及系统发育研究[J]. 中草药, 2023, 54(15): 4981-4991.
[28]
LUBNA, ASAF S, KHAN A L, et al. The dynamic history of gymnosperm plastomes: insights from structural characterization, comparative analysis, phylogenomics, and time divergence[J]. Plant Genome, 2021, 14(3): e20130. DOI:10.1002/tpg2.20130