我校华北作物改良与调控国家重点实验室马峙英团队,于2021年8月9日在国际遗传学顶级期刊《自然•遗传学》(nature genetics)在线长文发表“high-quality genome assembly and resequencing of modern cotton cultivars provide resources for crop improvement”研究论文。该研究率先组装陆地棉和海岛棉现代品种基因组,破译海陆种间、陆陆种内基因组结构变异及其规律,揭示陆地棉大规模种质材料变异的遗传效应,为作物重要性状改良提供了新的理论依据和资源。
陆地棉占全球棉花总产的90%以上,海岛棉约占10%并可提供优质纤维。育种家在获得多逆境抗性的同时,一直努力通过协同提高产量和品质来培育陆地棉新品种,并将海岛棉的优异性状转育到陆地棉中以进一步改良品质和抗性。然而,人们对棉花现代育成品种的基因组信息、现代育种过程中海陆棉种间基因组变异仍缺乏深入了解。基于更多基因组组装和品种资源重测序揭示的结构变异对于棉花分子改良非常重要,而有关棉花结构变异的规律和遗传效应还鲜为人知。
1.首次组装了陆、海现代品种高质量基因组,发现上千个棉属新基因。该研究率先组装了我国自育陆地棉现代品种农大棉8号(ndm8)(优质高产多抗,2010-2017年6次进入全国大田作物授权品种面积前十排行榜)和海岛棉新品系pima90(抗病优质,长期用于棉花抗病遗传、qtl定位和基因克隆及分子育种)的基因组。基因组重要质量参数:大小分别为2.29gb和2.21gb,contign50为13.15mb和9.24mb,基因组锚定率为99.57%和99.75%,gap比率为0.003%和0.06%。鉴定陆地棉ndm8基因80,124个,其中1,499个为预测的新基因;海岛棉pima90基因79,613个,其中1,267个为预测的新基因。98%以上的基因都能被多样化转录组数据支持。分析还发现,copia和gypsy转座子对农艺性状的分化起着重要作用。
2.破译了海岛棉、陆地棉结构变异图谱,发现一批影响基因表达的新变异。为了在陆地棉现代育种中潜在有效地利用海岛棉基因组变异,将pima90基因组与ndm8基因组比对分析,发现海岛棉存在高度的基因组多样性,共检测到846,363个结构变异。插入和缺失在d亚组上的密度明显高于a亚组;31,296对插入缺失-基因(基因内或和调控区两侧±1kb插入缺失)在海岛棉组织中显著特异表达;5,815个插入缺失位于5,256个基因的外显子区,其中3,178个变异与转录产物一致。发现pima90中编码蔗糖合酶的基因gbm_d13g2394存在2bp的缺失,该基因在纤维伸长期和次生壁加厚期的高表达,表明对海岛棉纤维长度和强度有重要作用。追踪利用pima90和ccri8海陆回交育成的新材料ndm373-9的基因组序列,发现该材料获得了来自于海岛棉的171个外显子区结构变异,其中有34个和12个基因分别与已报道的抗病性和纤维发育有关。
为了探明陆地棉现代品种的基因组变化,将ndm8基因组和tm-1(wang, m. j. et al. 2019)进行比较,发现ndm8存在76,568个结构变异,其中28,626个结构变异能够在10~1081个重测序种质材料中检测到。插入和缺失在d亚组上的密度明显高于a亚组,而且在端粒附近具有偏好性,是染色体其它区域的3.71倍。发现603个插入缺失位于526个基因的外显子区,同源基因中编码肉桂酰辅酶a还原酶的基因ghm_a02g1731在tm-1中存在1个缺失(剪切位点),导致该基因转录后的nad结构域受损,影响了基因的抗病性功能。研究还发现,现代品种较早期品种获得了1,128个ndm8基因组结构变异,反映了现代育种改良的选择效应。
3.探明了陆地棉结构变异的性状遗传效应,发现黄萎病抗性ghncs新基因。为探明基因组结构变异对重要性状的遗传效应,以现代品种ndm8为参考基因组,对1,081份世界各地的陆地棉种质资源重测序(平均10.65×)获得的304,630个结构变异,以及大规模环境评价获得的纤维长度、强度、铃重、衣分和黄萎病抗性数据分析,发现446个与重要性状显著关联结构变异。在dt11染色体的1个370kb区域内,有69个和56个ndm8型结构变异能够分别显著增加0.71~0.99mm和1.00~1.19mm的纤维长度,使得长度从27mm或者28mm级别增至29mm级别(纤维长度增加1mm,每吨皮棉售价一般可增加300元左右);在dt03染色体上的2个变异能够分别使衣分从37.49%增至39.69%、37.47%增至40.00%;在dt11染色体的69.00~69.33 mb区段内的3个变异能够使黄萎病病情指数(di)降低13.6,可使棉花抗性反应型从感病(di=44.5~45.2)变为耐病(di=30.9~31.1)。研究发现,品质性状的变异主要位于d亚组,而产量性状的主要位于a亚组;在907个与纤维品质、产量相关的基因中,84.23%的基因在纤维不同发育时期表达。在60个抗黄萎病基因中,编码s-去甲乌药碱合成酶基因ghncs,在抗黄萎病品种中的表达量显著低于感病品种,沉默该基因导致抗病性显著增强,使ndm8由耐病变为抗病,ccri8从感病变为耐病,然而拟南芥中过量表达该基因表现为更感病,表明ghncs是控制黄萎病抗性的一个重要新基因。
该研究得到国家重点研发计划(2016yfd0101405和2016yfd0101006)、国家棉花产业技术体系(cars15-03)、河北省科技支撑计划(16226307d)和河北省高端人才计划(031601801)资助。
作者:华北作物改良与调控国家重点实验室 编辑:宣传部 杨晓丽