2024年11月14日,北京大學現(xiàn)代農(nóng)業(yè)研究院郭立研究員團隊的本氏煙草完整基因組研究成果以“The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres”為題,在國際著名期刊Nature Plants上在線發(fā)表。
文章通過構建本氏煙草端粒到端粒無缺口基因組,對本氏煙草進行了亞基因組分型,進一步確定林煙草(N. sylvestris)和漸狹葉煙草(N. attenuata)最可能是其二倍體祖先物種。研究還深入解析了異源四倍體本氏煙草的著絲粒序列及其表觀特征,豐富了我們對本氏煙草基因組進化和著絲粒演化過程的認識。
文章標題:The complete genome assembly of?Nicotiana benthamiana?reveals the genetic and epigenetic landscape of centromeres
合作單位:北京大學現(xiàn)代農(nóng)業(yè)研究院
發(fā)表期刊:Nature Plants
研究對象:本氏煙草
百邁客生物為該研究提供了PacBio HiFi、Hi-C、Illumina和RNA-seq測序服務。
研究背景
本氏煙草(Nicotiana benthamiana)是一年生茄科煙草屬植物,原產(chǎn)于澳大利亞北部地區(qū),和用于制作香煙的普通煙草(N. tabaccum)是近緣物種。本氏煙草最為人知的是作為植物學和合成生物學研究的模式植物。本氏煙草憑借其對病毒的易感性和在瞬時基因表達的便利性成為了植物科學家的“寵兒”,同時它也是植物天然產(chǎn)物和疫苗異源合成的重要底盤生物。因此,解析本氏煙草的基因組密碼對促進植物科學研究和生物制藥產(chǎn)業(yè)具有重要的價值。本氏煙草是異源四倍體,由兩個二倍體祖先在距今500萬年-600萬年雜交形成,之后基因組演化形成現(xiàn)今的19對染色體。本氏煙草基因組約為2.85Gb,其草圖最早發(fā)表于2012年,之后的12年間多個改進版本的本氏煙草基因組陸續(xù)公布,組裝質量有了很大提升,但仍然存在多個缺口與組裝注釋錯誤,嚴重影響了對這一模式生物的功能基因組學的研究進程。
著絲粒是負責細胞分裂過程中染色體平均分配給子細胞的基因組關鍵區(qū)域,也被稱為基因組的暗物質區(qū)域。因其高度復雜并富含重復序列,著絲粒的序列很難被測序和破譯。近年來隨著測序技術和生物信息算法的快速發(fā)展,包括人類、擬南芥、酵母在內的多個模式生物以及玉米、水稻、辣椒、生菜等作物的著絲粒特征逐漸被揭示。這豐富了我們對這些基因組暗物質的認知,為疾病研究和治療、作物單倍體育種、人工染色體合成等前沿科學提供理論指導。然而,我們對生物界著絲粒的結構和進化理解仍然處在初期,絕大多數(shù)生物的著絲粒區(qū)域仍未解析。此外,多倍體生物例如四倍體本氏煙草、四倍體馬鈴薯、六倍體小麥等,基因組經(jīng)歷了復制、重排和結構變異等事件,在此過程中著絲粒如何演化和維持功能也有待闡明。異源四倍體的本氏煙草為這些問題的解答提供了一個理想的模型。
研究結果
研究團隊首先采用單分子測序技術(HiFi,116.7x?+ ONT ultra-long,47.9x),Hi-C(150x)和Bionano(329.6x)光學圖譜等多種技術相結合策略,構建了T2T無缺口的本氏煙草基因組(2.85 Gb),實現(xiàn)所有染色體的完整分型組裝(圖1),并鑒定到所有19個著絲粒和38個端粒,contig N50值達到146.4 Mb。隨后的質量評估表明該基因組具有很高的堿基準確性和組裝完整性。

圖1-本氏煙草T2T基因組全局特征、多倍體進化歷史和著絲粒演化進程
研究團隊還進一步基于著絲粒特異結合蛋白CENH3的ChIP-seq數(shù)據(jù),確定了本氏煙草基因組的完整著絲粒序列,并揭示了其著絲粒全景特征。令人驚訝的是,與辣椒和馬鈴薯等茄科作物的著絲粒(以LTR/Gypsy反轉錄轉座子為主)不同,本氏煙草著絲粒不僅有Gypsy序列,而且存在大量的衛(wèi)星(Satellite)DNA的重復陣列,暗示這些著絲粒特異的衛(wèi)星重復序列是在本氏煙草中新出現(xiàn)的(圖2)。經(jīng)過仔細分析,研究團隊證明了本氏煙草著絲粒衛(wèi)星陣列可能起源于核糖體DNA的基因間間隔序列。
此外,在著絲粒組蛋白CENH3優(yōu)先占據(jù)的區(qū)域,Gypsy反轉錄轉座子和核基因組線粒體插入序列(NUMT)廣泛侵入本氏煙草著絲粒,表明這些DNA元件在著絲粒功能中起著至關重要的作用。有趣的是,NUMT在本氏煙草著絲粒中的插入具有很強的亞基因組偏好性,并且主要與母體著絲粒周圍有關。亞基因組分析表明,衛(wèi)星陣列的出現(xiàn)可能推動了多倍體后著絲粒的形成(圖2)。
最后,該研究提出一個模型來解釋本氏煙草著絲粒的進化,即本氏煙草基因組在多倍化后通過新著絲粒形成、衛(wèi)星序列擴展、反轉錄轉座子的富集和NUMT整合而實現(xiàn)著絲粒進化(圖1),豐富了我們對于茄科植物和多倍體植物著絲粒演化的認知。

圖2-本氏煙草著絲粒衛(wèi)星重復序列推動新著絲粒的形成和進化
研究總結
該研究公布了模式植物本氏煙草的T2T無缺口基因組,并揭示了其著絲粒的全景結構及其表觀遺傳特征,該研究成果具有里程碑意義。本氏煙草完整基因組的破譯不但為植物科學研究提供了重要的遺傳資源,也將促進本氏煙草作為模式和底盤植物在生物技術領域的廣泛應用。
內容來源于北京大學現(xiàn)代農(nóng)業(yè)研究院,侵刪