摘要
【目的】 比较中国选育油橄榄品种与地中海油橄榄叶绿体基因组的多样性和亲缘关系,评估中国选育品种母系来源多样性,为中国油橄榄种质开发提供依据。【方法】基于本研究所测的9个中国选育油橄榄品种、7个伊朗种质和下载的52个地中海油橄榄种质的重测序数据,用NOVOPlasty组装叶绿体基因组,计算序列多态性;用GPA和RAxML-NG、Network 5.0等软件分别构建叶绿体基因组图谱、系统发育和单倍型网络关系。【结果】油橄榄叶绿体基因组在其四分体结构、基因数量上具有一致性;共检测到17个叶绿体单倍型,其中,中国选育油橄榄品种仅有1个单倍型,其多数为地中海栽培油橄榄共享;野生油橄榄序列多态性最高,其次为地中海栽培油橄榄和伊朗种质,而9个中国选育品种的多样性为0。系统发育和单倍型网络关系结果一致,中国选育品种与多数地中海栽培油橄榄、伊朗种质聚为一支。【结论】中国选育油橄榄品种母系来源多样性极低,后期需从更全面的油橄榄种质谱系选育适应中国生境的油橄榄品种。
Abstract
[Objective] The study aims to compare the genetic diversity and relationship between chloroplast genomes of olive varieties bred in China and those in the mediterranean olives, and to estimate the maternal diversity of olive varieties bred in China, in order to provide a basis for the development of Chinese olive accessions. [Methods] NOVOPlasty v.4.3.1 was used to assemble chloroplast genomes, which were based on the genome re-sequencing data of nine olive varieties bred in China and seven Iranian accessions, both of which were sequenced in this study, as well as fifty-two mediterranean olive accessions downloaded from the database. The sequence polymorphism was calculated. GPA, RAxML-NG, and Network 5.0, and other softwares were used to construct the chloroplast genome map, the relationship of phylogeny, and the network of haplotype, respectively. [Results] The chloroplast genomes of the tested olive accessions were consistent in terms of tetrad structure and number of genes. All chloroplast genomes identified seventeen haplotypes, among which the olive varieties bred in China had only one haplotype which was shared with the most mediterranean cultivated olives. The oleasters had the highest genetic diversity, followed by the mediterranean cultivated olives and then Iranian accessions, while nine olive varieties bred held all genetic diversity of 0. The phylogenetic relationship was consistent with the network of haplotype, and one branch contained most of the mediterranean cultivated varieties, including the Iranian olive accessions and all olive varieties bred in China. [Conclusion] The nine olive varieties bred in China shows an extremely low diversity of maternal origin. It is necessary to select and breed the olive varieties adapted to the habitats in China from a more comprehensive lineage of olive accessions in the later stages.
油橄榄(Olea europaea L.)又称齐墩果,属木犀科(Oleaceae)木犀榄属(Olea)常绿乔木,是世界著名的木本油料兼果用树种,被广泛栽培于地中海沿岸,其果实鲜榨而成橄榄油中富含油酸、角鲨烯等多种生理活性物质,具备养颜保健的功效[1-2],在国际上素有“植物油皇后”的美誉[3]。栽培油橄榄(O. europaea subsp. europaea var. europaea)可能由野生油橄榄(O. europaea subsp. europaea var. sylvestris)驯化而来,并早期种植于黎凡特地区,后来扩散到地中海沿岸[4-5]。Besnard等[6-7]基于油橄榄叶绿体基因组序列多态性的分析,发现地中海栽培油橄榄和野生油橄榄可划分为3个主要谱系:E1、E2、E3。地中海栽培油橄榄以谱系E1为主,其中E1.1是地中海地区最常见和广泛分布的单倍型,而野生油橄榄具有更多属于谱系E2和E3的罕见单倍型,其单倍型多样性较高。Julca等[8]通过质体和核基因SNPs 2种类型数据的系统发育分析表明,大部分地中海栽培油橄榄和野生油橄榄分别聚集在一起;同样发现油橄榄叶绿体基因组可分为E1、E2、E3这3个分支。
中国于20世纪60年代从国外大量引种油橄榄,找到了金沙江干热河谷区、白龙江低山红河谷区和长江三峡低河谷区等油橄榄一级适生区,四川盆地地缘地带和长江中游亚热带地带等4个区域二级适生区[9-10]。据《中国油橄榄产业发展蓝皮书(2022)》记述,如今中国油橄榄种植区域已发展到了12个省(区、市),种植面积增长到近1.2×109 m2,甘肃、云南、四川等主产地鲜果和初榨橄榄油的总产量明显增加。前期,中国油橄榄专家结合国内区域生态环境特点,采用以品种优选和实生优选为主的育种方法,陆续成功选育出了一批适宜于中国区域性生长的优选品种,如‘城固系列’、‘鄂植8号’等[9,11-12]。近年,中国有研究利用SSR分子标记等技术[13],鉴定并分析了中国油橄榄主产区的大部分品种及遗传多样性,多项研究结果表明,中国选育品种与意大利的品种亲缘关系相近,且引种主要来源于地中海西部的部分国家,品种来源有待多样化。
叶绿体基因组(chloroplast genome,cpDNA)具有独立的遗传信息,序列和结构高度保守,且在大部分被子植物中为母系遗传[14-16]。目前已有诸多关于油橄榄叶绿体基因组的研究,并对栽培油橄榄的起源和谱系分类等问题有了新的见解[7-8],而中国利用叶绿体基因组对油橄榄种质的研究较少[17],有关已选育油橄榄品种的单倍型谱系及其母系来源多样性鲜见探究。本研究基于包括中国选育油橄榄品种在内的68个油橄榄进行叶绿体基因组的多样性和系统发育分析,评估本土选育油橄榄品种的母系来源多样性,为中国选育油橄榄品种及相关资源的开发提供科学依据。
1 材料和方法
1.1 材料收集、序列数据下载
研究共分析了68个油橄榄叶绿体基因组序列,包括本研究经重测序后组装的16个及从ENA数据库下载地中海栽培油橄榄和野生油橄榄的重测序数据[8],再组装出的52个。研究重测序个体包括采自甘肃省陇南市武都区大湾沟国家油橄榄良种繁育基地(简称“大湾沟”)和陇南市经济林研究院油橄榄研究所科研试验园(简称“陇南油橄榄试验园”)的中国本土选育品种共9个(表1);伊朗国家遗传工程和生物技术研究所(NIGEB)提供的伊朗油橄榄种质7个。从NCBI数据库(https://www.ncbi.nlm.nih.gov/)下载4个油橄榄近缘亚种(O. europaea subsp. cuspidata、O. europaea subsp. laperrinei、O. europaea subsp. guanchica、O. europaea subsp. maroccana)的叶绿体基因组序列作为外类群。
表1中国选育油橄榄品种信息
Table1Information of olive varieties selected and bred in China
1.2 基因组DNA提取及重测序、质控
用植物组织基因组DNA提取试剂盒(北京天根生化科技有限公司)提取样品的基因组DNA(表1),在1%琼脂糖凝胶上检测后,将其保存在-20℃ 冰箱。将所提取的基因组 DNA 送至北京贝瑞和康生物技术有限公司Illumina Hiseq 2500平台上进行重测序,构建长度350 bp的文库,测序深度30×,每个样本的平均原始数据量为45 G。通过在线软件FastQC[18](https://github.com/s-andrews/FastQC/issues/)评估本研究和网上下载重测序数据质量,然后用Trimmomatic v.0.39[19]对所有原始数据进行质控处理。
1.3 叶绿体基因组组装及注释
用NOVOPlasty v.4.3.1 软件[20],完成质控的重测序数据组装叶绿体基因组序列。以油橄榄叶绿体基因的rpl32序列(NCBI登录号:HQ241938)作为种子序列,以油橄榄原亚种O. europaea subsp. europaea Oeiras 1(NCBI登录号:MG255763)作为参考基因组。设置参数:K-mer=39,type=chloro,基因组范围120 000~200 000,其余参数设置为默认值。
为了减少叶绿体基因组中2个完全一致的反向重复区序列对系统发育树构建的影响,用在线基因注释网站CHLOROBOX[23](https://chlorobox.mpimp-golm.mpg.de/geseq.html)查看每个个体序列结构,然后删除1个反向重复区IRA序列。
1.4 油橄榄叶绿体基因组结构及多态性分析
基于叶绿体基因组的全长序列,对中国选育油橄榄品种和参考叶绿体基因组的结构进行分析,统计包括叶绿体基因组大单拷贝区(large single copy,LSC)、小单拷贝区(small single copy,SSC)以及反向重复区(inverted repeats,IR)的长度、基因数量、GC含量。
用软件DnaSP v5[24]确定所有的油橄榄叶绿体基因组单倍型,分别计算中国选育油橄榄品种(简称‘中国油橄榄’)、地中海栽培油橄榄品种(简称‘栽培油橄榄’)、野生油橄榄以及伊朗特有油橄榄种质(简称‘伊朗油橄榄’)叶绿体基因组的变异位点、核苷酸多样性(nucleotide diversity,Pi)、平均核苷酸差异、单倍型数目、单倍型多样性。
1.5 油橄榄叶绿体基因组系统发育树的构建
用软件Modeltest-ng v0.1.6[25],基于贝叶斯信息准则(bayesian information criterion,BIC)选择最佳模型为 TPM1uf+G4;以下载的4个油橄榄近缘亚种作为外类群;用软件RAxML-NG [26]的最大似然法(ML)构建所有叶绿体基因组序列的系统发育树,自展值(bootstrap)为1 000。
1.6 油橄榄叶绿体基因组单倍型的分布及网络构建
每个单倍型选择一条序列,构建叶绿体基因组单倍型系统发育树。用软件 Modeltest-ng v0.1.6,基于BIC确定最佳模型为 TPM1uf+G4;在软件RAxML-NG的参数中,4个油橄榄近缘亚种作为外类群,自展值(bootstrap)设置为100进行系统发育树的构建。用中介邻接网络(median-joining network,MJ)算法,用Network 5.0 软件(http://www.fluxus-engineering.com/sharenet.htm)构建叶绿体基因组单倍型间的网络关系[27]。
2 结果与分析
2.1 油橄榄叶绿体基因组特征
研究组装的完整叶绿体基因组图谱如图1所示,以中国油橄榄种植区内最为广泛种植的品种‘鄂植8号’作为结果展示。所有油橄榄的叶绿体基因组均为四分体结构,据统计结果,‘鄂植8号’等9个中国选育油橄榄的叶绿体基因组大小为155 886 bp,LSC、SSC与IR各区域长度分别为86 571 bp、17 835 bp、25 740 bp。LSC、SSC与IR区域及总叶绿体的GC含量分别为35.8%、32.0%、43.2%、37.8%。蛋白编码基因、转运RNA、核糖体RNA的数量分别为88、35、8,去除重复后分别为80、26、4。
2.2 油橄榄叶绿体基因组序列多态性及单倍型结果
所有分析的68个油橄榄叶绿体基因组序列的长度为155 658~155 937 bp,每条序列的总GC含量均约为37.8%;去掉IRA,比对调整后每条基因序列得到长度为129 501 bp的序列矩阵。在68个油橄榄种质中共检测到17个叶绿体单倍型。其中,野生油橄榄检测到9个单倍型,地中海栽培油橄榄和伊朗油橄榄分别检测到8个和4个,中国9个本土选育油橄榄品种仅有1个单倍型。
所有种质的核苷酸多样性指数为0.000 20。其中,野生油橄榄的核苷酸多样性(Pi=0.000 30)和单倍型多样性(Hd=0.955)均最高;伊朗油橄榄单倍型多样性(Hd=0.810)次之,但核苷酸多样性不高(Pi=0.000 01);地中海栽培油橄榄单倍型多样性(Hd =0.708)稍低,但核苷酸多样性居中(Pi=0.000 20);中国本土选育油橄榄品种各多样性指数均为0(表2)。
图1研究组装的油橄榄‘鄂植8号’叶绿体基因组图谱
Fig.1A gene map of the chloroplast genome of O. europaea ‘Ezhi8’ in current study
表268个油橄榄叶绿体基因组多态性及单倍型信息
Table2Chloroplast genome polymorphism and haplotype information of 68 olive accessions
2.3 油橄榄叶绿体基因组系统发育树
基于68个油橄榄叶绿体基因组构建的系统发育树(图2)显示,以油橄榄亚种[(O. europaea subsp.)cuspidata、laperrinei、guanchica、maroccana]作为外类群,所有油橄榄种质叶绿体基因组为多系起源;以maroccana和guanchica分支(支持率为97%)为外类群,所有油橄榄种质序列可分为3个支持率较高的分支。
图2基于叶绿体基因组的油橄榄系统发育树
Fig.2Phylogenetic tree of the olives based on chloroplast genomes
红色代表中国选育油橄榄品种,蓝色代表野生油橄榄,黑色代表地中海栽培油橄榄,绿色代表伊朗油橄榄种质,进化枝的数字代表支持率(%)。
Red represents the selected and bred Chinese olive varieties, blue represents the oleasters, black represents the mediterranean cultivated olive, and green represents the iranian olive accessions. The number of the evolutionary branch represents the support rate (%) .
第1分支中,中国选育油橄榄品种和伊朗油橄榄种质、地中海大部分栽培油橄榄和少数的野生油橄榄聚在一起(支持率84%),此分支与油橄榄亚种laperrinei关系更近(支持率91%),此分支中,中国选育品种与大多数地中海油橄榄及伊朗油橄榄种质聚为一分支(支持率为69%);第2分支(支持率为93%)包含7个地中海栽培油橄榄品种和4个野生油橄榄种质;第3个分支包括4个栽培油橄榄品种和5个野生油橄榄种质(支持率为93%),此分支与近缘亚种cuspidata关系更近(支持率82%)。
2.4 油橄榄叶绿体基因组单倍型系统发育树
油橄榄叶绿体DNA单倍型建树结果(图3,A)显示,首先外类群maroccana和guanchica聚为独立的一支(支持率为100%),然后单倍型Hap1-Hap17和近缘亚种cuspidata、laperrinei聚为一较大分支(支持率为42%),单倍型Hap7-Hap11又聚为另一分支(支持率为100%)。在较大分支中,单倍型Hap1-Hap6和外类群聚为一个小分支(支持率为48%),其中,近缘亚种 laperrinei独立进化成一支,与其他单倍型进化距离甚远,然后其与单倍型Hap1-Hap6聚集为另一分支(支持率为100%);单倍型Hap12-Hap17聚为一小支(支持率为100%)。
2.5 油橄榄叶绿体基因组单倍型的地理分布及网络关系
基于68个油橄榄的叶绿体基因组得到的总计17个单倍型分布结果(表3)显示,地中海沿岸国家依次从西部到东部(葡萄牙至叙利亚),单倍型Hap1为主要类型,从地中海西部到东部有所广泛分布;中国的9个选育油橄榄品种全部共享单倍型Hap1。地中海地区的栽培油橄榄品种从西部到东部共有8个单倍型(表3),西部的单倍型类型较多,其中,来自西班牙的油橄榄及其单倍型的数量最丰富,以单倍型Hap1占比最大;其次,中部的希腊和东部的叙利亚均含有3个单倍型,其中,希腊含有独特的单倍型Hap3;此外,伊朗的7个油橄榄种质共鉴定到4个单倍型Hap1、Hap2、Hap4、Hap6,其中,Hap6是独有的单倍型,其余的单倍型与其他地中海油橄榄共享。
用Network 软件的中介邻接网络(median-joining network,MJ)算法,构建得到油橄榄叶绿体基因组单倍型网络关系(图3,B),揭示出17种单倍型之间的关系。
图3油橄榄叶绿体基因组的17个单倍型系统发育树(A)及网络关系(B)
Fig.3Phylogenetic tree (A) and network relationships (B) of 17 haplotypes of olive chloroplast genomes
不同颜色方块对应不同的单倍型,具有斜线的方块表示含有野生油橄榄的单倍型; *表示支持率为100%,方块颜色代表不同的单倍型。黑色圆圈代表缺失的单倍型,圆圈大小代表到单倍型频率,圆圈颜色代表不同的单倍型,斜线及面积大小表示野生油橄榄数量所占比例,对应于A中的方块的颜色,单倍型之间连线上的数字代表碱基替换个数。
Squares with different colors correspond to different haplotypes, and squares with slashes indicate haplotypes containing oleasters. * indicates the support rate is 100%, and the color of the square represents different haplotypes. The black circles are the unknown haplotypes, and the size of the circle represents the frequency of haplotype. The color of the circle represents different haplotypes. The slash and the area size are the proportion of oleasters, corresponding to the color of the square in A. The number of the lines between haplotypes represent the number of base substitutions.
总体上可分为3个支系,与叶绿体基因组单倍型系统发育树分类基本一致,同时包含4个未知的单倍型。其中的2个支系(Hap13-Hap16、Hap7-Hap11),出现更多野生油橄榄和栽培油橄榄的单倍型混合,且衍生出较多独立的野生油橄榄单倍型。另外一支系(Hap1-Hap6),包含数量最多的栽培油橄榄品种,且以单倍型Hap1为优势,为地中海栽培油橄榄最广泛分布的单倍型。同时,发现伊朗的特有单倍型Hap6,其与Hap1的进化关系较其他单倍型更近。
表368个油橄榄的单倍型地理分布统计
Table3Statistics on the geographical distribution of haplotypes of 68 olives
注:标记*的数字表示野生油橄榄的数量。
Note: The number marked * indicates the number of oleasters.
3 讨论
植物遗传变异的研究大多基于核基因或叶绿体基因组数据;前者为双亲遗传,后者在大多数被子植物中为母系遗传,可为栽培品种的亲缘关系及母系来源多样性提供重要参考价值[28-31]。在本研究的叶绿体基因组的组装中,大部分基于网上下载的油橄榄种质的重测序数据,包括栽培油橄榄和野生油橄榄,且主要来源于Julca等[8]研究。基于叶绿体基因组构建的系统发育进化树(图2)结果和Julca等[8]研究一致,即地中海栽培油橄榄的遗传多样性低于野生油橄榄(表2);多数地中海栽培油橄榄聚集为一较大分支(E1),野生油橄榄和栽培油橄榄种质混合聚成2个分支(E2和E3)。本研究最新组装的中国选育品种和7个伊朗油橄榄种质的叶绿体基因组均属于E1支系。地中海栽培油橄榄单倍型多样性差异较为明显(表3),西部的单倍型多样性较高,主要集中在西班牙,而东部相对较低。同时,少量单倍型仅在地中海西部和中部中被检测到,该结果与前人的研究结果[6,16]一致。此外,本研究发现,伊朗7个油橄榄种质检测到的4种单倍型中,Hap6为特有单倍型,与单倍型Hap1仅差1个碱基的突变(图3,B)。中国选育的9个油橄榄品种仅检测出1个单倍型,为地中海地区最广泛分布的Hap1(图3),表明中国选育油橄榄品种的母系多样性非常低。
中国选育油橄榄品种的叶绿体基因组各区域的长度及其各GC含量、去重后的蛋白编码基因、转移RNA、核糖体RNA的数量是相等的,与前人所研究[17]相符合。据记载(表1),本研究涉及到的中国选育油橄榄品种的亲本,原产地多数来自地中海地区个别国家[8]。如‘玉婵44号’的无性系亲本‘莱星’‘Leccino’均来自意大利,‘海口1’的实生选育亲本‘希玛’‘Himares’源于阿尔巴尼亚,‘城固’系列的亲本均来自前苏联的尼基塔植物园。该记录部分得到了近期分子鉴定的验证,如‘玉蝉 44号’与‘莱星’为同一基因型[12]。此外,Huang等[32]利用开发的单拷贝核基因(SCO)序列标记的分析,发现多数选育品种遗传多样性较低,大部分选育品种,如‘玉蝉44号’、‘城固32号’、‘会理’等与‘佛奥’、‘莱星’、‘贺吉布兰卡’、‘小苹果’等多数地中海主栽油橄榄品种关系相近。
基于此,推测本研究的中国选育品种叶绿体基因组单倍型单一化的主要原因如下:首先,中国早期引进地中海栽培油橄榄的原产国来源不足,主要是从阿尔巴尼亚和前苏联引进,部分种质来自西班牙、意大利等几个主栽油橄榄国家,因此,可供选育的母本多样性不高。其次,中国选育品种以主栽榨油品种为主,例如以‘Frantioio’、‘Leccino’等地中海品种为基础,这些主栽品种虽然具备优良遗传特征和特性[33-34],但其大部分之间的亲缘关系相近,单倍型属于同一谱系[8]。最后,早年中国选育适合的油橄榄品种主要以现有品种单株选优和实生选育的方式进行[35],这就更造成母本来源多样性不高。近年来,中国虽然从国外引进了大量的新种质,但是对新种质的研究甚少,基于这些种质开展选育的工作仍在进行中。
4 结论
中国选育油橄榄品种与大多数地中海栽培油橄榄的亲缘关系相近且所属谱系一致;中国选育油橄榄品种的叶绿体单倍型较单一,从9个选育品种中仅发现1种地中海广泛存在的单倍型,反映出其母本来源多样性较低。中国引进油橄榄种质的叶绿体单倍型、谱系类型及来源国过少,前期选育种质基础来源不足,其可能是叶绿体母本来源有限的主要原因。在中国今后的油橄榄品种选育过程中,可考虑基于来源更多样化的油橄榄谱系中进行选优,为中国油橄榄栽培提供更丰富的适应品种。







