一種基因測(cè)序數(shù)據(jù)重組封裝的方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110810347.2 申請(qǐng)日 -
公開(公告)號(hào) CN113268461B 公開(公告)日 2021-09-17
申請(qǐng)公布號(hào) CN113268461B 申請(qǐng)公布日 2021-09-17
分類號(hào) G06F16/174(2019.01)I;G16B30/00(2019.01)I;G16B50/50(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 郭祥學(xué);張巍 申請(qǐng)(專利權(quán))人 廣州嘉檢醫(yī)學(xué)檢測(cè)有限公司
代理機(jī)構(gòu) 廣州君策達(dá)知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 陳宏升
地址 510000廣東省廣州市黃埔區(qū)廣州國(guó)際生物島螺旋四路9號(hào)第二層C201單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基因測(cè)序數(shù)據(jù)重組封裝的方法,包括如下步驟,步驟1:構(gòu)建參考基因組數(shù)據(jù)庫(kù)和基因字典;步驟2:獲取樣品中染色體的第二基因序列;步驟3:將步驟2的第二基因序列和多條第一基因序列進(jìn)行比對(duì);步驟4:將第二基因序列和標(biāo)準(zhǔn)基因進(jìn)行比對(duì);步驟5:將基因片段中的核苷酸以N個(gè)為一組依次進(jìn)行分組;步驟6:將前段、基因片段、后段用基因字典中的代號(hào)表示,形成一組核苷酸數(shù)據(jù);步驟7:將不同染色體上的核苷酸數(shù)據(jù)進(jìn)行統(tǒng)計(jì)并壓縮即可得到壓縮后的基因組數(shù)據(jù);步驟8:還原得到樣品的第二基因序列。本發(fā)明將一小段核苷酸采用字典代碼化,能夠?qū)崿F(xiàn)數(shù)據(jù)的有效壓縮;同時(shí),本發(fā)明還提供基于該方法的裝置。