一種基于后綴樹(shù)算法的基因組測(cè)序序列與參考基因組比對(duì)的方法

基本信息

申請(qǐng)?zhí)?/td> CN202011599753.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112802553A 公開(kāi)(公告)日 2021-05-14
申請(qǐng)公布號(hào) CN112802553A 申請(qǐng)公布日 2021-05-14
分類(lèi)號(hào) G16B30/10 分類(lèi) 物理
發(fā)明人 張靜波;姬曉勇;高司航;單光宇;伍啟熹;王建偉;劉倩;唐宇 申請(qǐng)(專(zhuān)利權(quán))人 北京優(yōu)迅醫(yī)療器械有限公司
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 商秀玲
地址 102600 北京市大興區(qū)中關(guān)村科技園區(qū)大興生物醫(yī)藥產(chǎn)業(yè)基地永大路38號(hào)4號(hào)樓南半側(cè)1至3層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及生物信息技術(shù)領(lǐng)域,具體涉及一種基于后綴樹(shù)算法的基因組測(cè)序序列與參考基因組比對(duì)的方法。本發(fā)明提供的基于后綴樹(shù)算法的基因組測(cè)序序列與參考基因組比對(duì)的方法包括構(gòu)建參考基因組索引以及將基因組測(cè)序序列與參考基因組索引進(jìn)行序列比對(duì)的步驟,其中,所述構(gòu)建參考基因組索引包括如下步驟:(1)構(gòu)建參考基因組索引的初步后綴樹(shù);(2)將所述初步后綴樹(shù)中含有分叉的節(jié)點(diǎn)轉(zhuǎn)換成節(jié)點(diǎn)數(shù)字,不含有分叉的節(jié)點(diǎn)轉(zhuǎn)換成節(jié)點(diǎn)矩陣,構(gòu)建后續(xù)用于比對(duì)的最終后綴樹(shù)。本發(fā)明提供了一種占用內(nèi)存相對(duì)較小、運(yùn)行速度較快的、基于后綴樹(shù)算法進(jìn)行序列比對(duì)的方法,有效降低了讀入索引對(duì)計(jì)算機(jī)內(nèi)存的要求。