基因組Denovo
不依賴于任何參考(kao)序(xu)列(lie)信息就可對某個物種進行(xing)全基(ji)(ji)因(yin)組(zu)測序(xu)和拼接組(zu)裝(zhuang),并對組(zu)裝(zhuang)得到(dao)的(de)(de)基(ji)(ji)因(yin)組(zu)序(xu)列(lie)進行(xing)組(zu)分(fen)和功(gong)能(neng)注釋,構建該物種的(de)(de)全基(ji)(ji)因(yin)組(zu)序(xu)列(lie)圖(tu)譜與基(ji)(ji)因(yin)組(zu)數據庫,為后續(xu)基(ji)(ji)因(yin)挖掘、功(gong)能(neng)驗證提(ti)供更完善的(de)(de)基(ji)(ji)因(yin)組(zu)序(xu)列(lie)信息。
基因組Survey(二代測序)
基于小(xiao)片段(duan)文庫的二代測序數(shu)據,通(tong)過K-mer分析,有效評估基因組大小(xiao)、GC含量、雜合度高(gao)低(di)及重(zhong)復(fu)序列(lie)含量等信息,為后續(xu)的組裝策略的制定提供理論依據。
基因組Denovo(三代測序)
對基因(yin)組序(xu)列(lie)未知(zhi)的(de)物種進行全(quan)基因(yin)組水平的(de)深度測序(xu),然后用生物信息學方法(fa)進行組裝和注釋,從而獲得該物種完整的(de)基因(yin)組圖(tu)譜,有(you)助(zhu)于(yu)研究該物種起源進化及(ji)特(te)定環(huan)境適應性(xing)。
泛基因組(三代測序)
是指一(yi)個(ge)(ge)(ge)生物(wu)分支(如一(yi)個(ge)(ge)(ge)物(wu)種)的(de)全部基(ji)(ji)因(yin)組信息,由所有(you)個(ge)(ge)(ge)體(ti)(ti)共享(xiang)的(de)核心基(ji)(ji)因(yin)組和(he)部分個(ge)(ge)(ge)體(ti)(ti)共享(xiang)或個(ge)(ge)(ge)體(ti)(ti)特(te)異(yi)性(xing)的(de)非必需基(ji)(ji)因(yin)組成。通過構建泛基(ji)(ji)因(yin)組,可以(yi)將(jiang)每個(ge)(ge)(ge)物(wu)種中的(de)代表性(xing)個(ge)(ge)(ge)體(ti)(ti)的(de)特(te)異(yi)基(ji)(ji)因(yin)組序列包括到泛基(ji)(ji)因(yin)組中,獲得(de)物(wu)種更全面的(de)遺(yi)傳信息。
T2T基因組(三代測序)
T2T基(ji)因(yin)(yin)組中(zhong)的(de)T即端(duan)(duan)粒(Telomere),是真核生物線性染色(se)體的(de)末端(duan)(duan)部分,完(wan)美(mei)基(ji)因(yin)(yin)組(T2T)追(zhui)求(qiu)基(ji)因(yin)(yin)組組裝從(cong)染色(se)體的(de)一端(duan)(duan)到(dao)另外一端(duan)(duan),準確、完(wan)整(zheng)(zheng)識別每一個堿基(ji),無錯誤還原(yuan)基(ji)因(yin)(yin)的(de)原(yuan)始序列信息(xi)。通過三(san)代測序/Hic等(deng)多種技(ji)術手段結(jie)合實現一條或多條染色(se)體端(duan)(duan)粒到(dao)端(duan)(duan)粒水平組裝的(de)0 gap基(ji)因(yin)(yin)組,解決高(gao)(gao)復雜高(gao)(gao)重復區域的(de)組裝難題,最終得到(dao)高(gao)(gao)準確性、高(gao)(gao)連續性、高(gao)(gao)完(wan)整(zheng)(zheng)性的(de)端(duan)(duan)粒到(dao)端(duan)(duan)粒的(de)完(wan)整(zheng)(zheng)基(ji)因(yin)(yin)組。
單倍型基因組(三代測序)
單倍(bei)(bei)(bei)型(xing)(xing)(xing)(xing)(Haplotype)是是指共存于(yu)單條染色(se)(se)體(ti)(ti)上的(de)一系列遺(yi)傳變異(yi)位點的(de)組(zu)(zu)合。常用的(de)基(ji)因(yin)組(zu)(zu)組(zu)(zu)裝方法往往忽略了同源(yuan)染色(se)(se)體(ti)(ti)之間(jian)的(de)差異(yi),將雜(za)合區域整合,得(de)到的(de)基(ji)因(yin)組(zu)(zu)混雜(za)了來(lai)自雙親(qin)同源(yuan)染色(se)(se)體(ti)(ti)等位基(ji)因(yin)的(de)嵌合序列。以(yi)PacBio HiFi數(shu)據(ju)為核(he)心(xin)進(jin)行單倍(bei)(bei)(bei)型(xing)(xing)(xing)(xing)基(ji)因(yin)組(zu)(zu)研究。分析內容(rong)主要涵蓋單倍(bei)(bei)(bei)型(xing)(xing)(xing)(xing)基(ji)因(yin)組(zu)(zu)組(zu)(zu)裝、Hi-C輔(fu)助單倍(bei)(bei)(bei)型(xing)(xing)(xing)(xing)基(ji)因(yin)組(zu)(zu)組(zu)(zu)裝和單倍(bei)(bei)(bei)型(xing)(xing)(xing)(xing)基(ji)因(yin)組(zu)(zu)注釋,是研究結構(gou)、功能、變異(yi)與進(jin)化(hua)的(de)較理(li)想方式。
單倍型T2T基因組(三代測序)
單(dan)倍(bei)型(xing)(xing)(xing)T2T基(ji)因(yin)(yin)組,結合(he)T2T基(ji)因(yin)(yin)組的最新組裝策略(lve),并(bing)通過單(dan)倍(bei)型(xing)(xing)(xing)基(ji)因(yin)(yin)組組裝區分來(lai)自雙親的染色體,獲得分別來(lai)自父本(ben)(ben)、母本(ben)(ben)的完整遺傳(chuan)信息,構(gou)建更(geng)加(jia)完整的基(ji)因(yin)(yin)組,進而(er)研(yan)究雙親單(dan)倍(bei)型(xing)(xing)(xing)之間的差異、等位基(ji)因(yin)(yin)變異、追蹤個體親緣關(guan)系、探(tan)究雜種優(you)勢等。
超大基因組(三代測序)
大型(xing)(xing)基(ji)(ji)(ji)因(yin)組(5 Gb≤ Genome Size<10 Gb)和超大型(xing)(xing)基(ji)(ji)(ji)因(yin)組(Genome Size≥10 Gb) 在(zai)進化(hua)(hua)期間往(wang)(wang)往(wang)(wang)伴隨著(zhu)多倍體化(hua)(hua)或全基(ji)(ji)(ji)因(yin)組復(fu)(fu)制等(deng)(deng)事件的(de)發生,造成其基(ji)(ji)(ji)因(yin)組存在(zai)大量的(de)重復(fu)(fu)序(xu)(xu)列(lie)(lie),使得(de)大型(xing)(xing)基(ji)(ji)(ji)因(yin)組在(zai)組裝(zhuang)(zhuang)時會存在(zai)組裝(zhuang)(zhuang)連續(xu)性(xing)低、重復(fu)(fu)序(xu)(xu)列(lie)(lie)難以(yi)跨(kua)越、組裝(zhuang)(zhuang)資源消耗大和組裝(zhuang)(zhuang)周期長(chang)等(deng)(deng)難題。隨著(zhu)長(chang)讀(du)長(chang)測(ce)序(xu)(xu)技術的(de)發展和組裝(zhuang)(zhuang)算(suan)法的(de)優化(hua)(hua)升級,現階段已可以(yi)對(dui)大型(xing)(xing)基(ji)(ji)(ji)因(yin)組物(wu)種進行全基(ji)(ji)(ji)因(yin)組測(ce)序(xu)(xu)和拼接組裝(zhuang)(zhuang),獲得(de)該(gai)物(wu)種完整的(de)基(ji)(ji)(ji)因(yin)組圖譜,為后續(xu)該(gai)物(wu)種的(de)研究奠(dian)定基(ji)(ji)(ji)礎。
應用方向
- 全面基因組信息挖掘:更完善的參考基因組,可以校正之前基因組組裝的錯誤,發現新的基因序列,鑒定新的功能基因和遺傳變異信息,也可以鑒定出更多此前未被成功組裝的重復序列、著絲粒和端粒等;
- 物種進化和起源分析:解開物種的遺傳密碼,探尋物種祖先種及其遺傳多樣性為提高物種進化潛力和適應能力提供了新的可能性;
- 作物育種與改良:幫助種質資源的遺傳多樣性和遺傳價值評估,了解物種間的遺傳差異和關系,作為其他組學的研究基礎為遺傳改良提供最完善的參考信息;
案例解析

32份黍稷種質(zhi)資(zi)源的(de)泛基因(yin)集(ji)分析
黍稷圖形泛基因組揭示馴化相關的基因組變異
中國農業科學院作物科學研究所刁現民團隊聯合陳金鋒團隊在《Nature Genetics》發表論文“Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet”。該研(yan)究首次揭(jie)示(shi)了(le)(le)(le)世(shi)界范圍內516種(zhong)黍(shu)稷(ji)種(zhong)質資源(yuan)的(de)(de)遺傳變異多(duo)樣性及起源(yuan)和傳播的(de)(de)演化史(shi)。利用PacBio HiFi測(ce)序(xu)對(dui)黍(shu)稷(ji)24份(fen)栽(zai)培材料和8份(fen)野生材料的(de)(de)基(ji)(ji)(ji)因組(zu)進行從頭組(zu)裝,得到了(le)(le)(le)32個(ge)黍(shu)稷(ji)染色體水平的(de)(de)高(gao)質量(liang)參考(kao)基(ji)(ji)(ji)因組(zu),基(ji)(ji)(ji)因組(zu)Contigs N50長度平均為12.95Mb,BUSCO完整(zheng)性平均為95.97%。該研(yan)究發現了(le)(le)(le)與馴化和農藝性狀相關的(de)(de)關鍵位(wei)點和基(ji)(ji)(ji)因。為開展黍(shu)稷(ji)基(ji)(ji)(ji)因組(zu)輔(fu)助(zhu)育種(zhong)提供了(le)(le)(le)基(ji)(ji)(ji)礎資源(yuan)。貝瑞基(ji)(ji)(ji)因為該研(yan)究提供了(le)(le)(le)基(ji)(ji)(ji)于PacBio平臺(tai)的(de)(de)三代建庫測(ce)序(xu)服務。
參考文獻:Jinfeng Chen , Yang Liu, et al. Pangenome analysis reveals genomic variations associated with domestication traits in broomcorn millet[J]. Nature Genetics, 2023, 55(12):2243-2254.